摘要: 高维是大数据的一个重要特点,数据降维是处理高维数据的有效手段.数据降维算法的设计,关键在于保持原始高维数据集中蕴含的判别信息和几何结构,使得生成的低维特征表示既能刻画原始高维数据的分布形状,又能以更低的计算成本服务于后续的分类任务.边界判别投影算法是一种有监督的线性降维算法,通过最大化不同类别样本点之间的最小距离和最小化同类样本点之间的最大距离,来获取最优判别投影方向.为了保持样本点的几何结构,提高边界判别投影算法的泛化能力,在边界判别投影模型中融入了样本点的局部差异性信息.通过最大化投影之后样本点之间的局部差异来保持数据集的多样性,即在数据降维过程中,局部邻域内相距较远的样本点在投影之后应该保持较远的距离,从而防止在投影过程中原始数据集中蕴含的相似关系和拓扑结构发生扭曲.在图嵌入框架下,数据集的相似信息、判别信息和局部差异信息可以采用正则化的迹差准则进行数据建模.在优化求解时,为了降低散度矩阵特征分解的时间复杂度,通过对数据矩阵进行QR分解来加速计算.人脸图像数据集上的分类实验验证了局部差异正则化的边界判别投影算法在判别特征提取方面的有效性.
摘要:高维是大数据的一个重要特点,数据降维是处理高维数据的有效手段.数据降维算法的设计,关键在于保持原始高维数据集中蕴含的判别信息和几何结构,使得生成的低维特征表示既能刻画原始高维数据的分布形状,又能以更低的计算成本服务于后续的分类任务.边界判别投影算法是一种有监督的线性降维算法,通过最大化不同类别样本点之间的最小距离和最小化同类样本点之间的最大距离,来获取最优判别投影方向.为了保持样本点的几何结构,提高边界判别投影算法的泛化能力,在边界判别投影模型中融入了样本点的局部差异性信息.通过最大化投影之后样本点之间的局部差异来保持数据集的多样性,即在数据降维过程中,局部邻域内相距较远的样本点在投影之后应该保持较远的距离,从而防止在投影过程中原始数据集中蕴含的相似关系和拓扑结构发生扭曲.在图嵌入框架下,数据集的相似信息、判别信息和局部差异信息可以采用正则化的迹差准则进行数据建模.在优化求解时,为了降低散度矩阵特征分解的时间复杂度,通过对数据矩阵进行QR分解来加速计算.人脸图像数据集上的分类实验验证了局部差异正则化的边界判别投影算法在判别特征提取方面的有效性.
说明:如本页面涉及到版权问题或作者不愿意公开,请联系本站管理员删除!
[1] | 杨洋 刘磊 李广力 张桐搏 吕帅 . 一种新的基于局部搜索的扩展规则推理方法 [J]. 计算机学报 ,2018,4 |
[2] | 殷亚琪 杨联强 王学军 . 局部权重调节的自适应惩罚样条回归模型 [J]. 应用数学 ,2018,3 |
[3] | 冯依虎 莫嘉琪 . 一类具有摄动边界的非局部反应扩散方程Robin问题 [J]. 应用数学 ,2016,3 |
[4] | 赵静 张晓彤 胡克 王汉萍 徐燕 斯晓燕 钟巍 黄霞 张力 . 紫杉醇联合卡铂三周方案同步胸部放疗治疗不宜手术的局部晚期非小细胞肺癌疗效和安全性研究:一项来自单中心的回顾性研究 [J]. 中国肺癌杂志 ,2016,11 |
[5] | 孙臻峰 陈霞芳 张渊 . 丙酸氟替卡松局部治疗鼻息肉作用机制的探讨 [J]. 中国临床药学杂志 ,2008,6 |
[6] | 王炜 王虔 . NDP联合5-FU诱导化疗治疗局部晚期鼻咽癌的疗效及MRI的临床评估价值 [J]. 中国CT和MRI杂志 ,2018,4 |
[7] | 田浩 叶友达 蒋勤学 何先耀 . 真实气体效应对升力体舵面局部流动分离的影响 [J]. 空气动力学学报 ,2015,3 |
[8] | 李合平 . 探讨不同疗法对表阿霉素外渗后局部组织损伤修复的理想方法 [J]. 航空军医 ,2017,6 |