一种基于配对矩阵改进的LE分类算法 陈张莉,柳先辉,赵卫东 (同济大学电子与信息工程学院,上海〓201804) 拉普拉斯特征映射(LE)算法基于流形学习思想将原始数据映射到低维空间,然而其无法解决样本外点学习问题,更没有使用类别信息。针对这些实际应用问题提出了一种新的基于配对矩阵的拉普拉斯特征映射(PM-LE)算法。PM-LE的目标是使得高维空间中的“相似点”投影到本征低维空间后为近邻点,同时该算法引入类别信息帮助构建近邻图,并且利用最大化相似矩阵及其配对矩阵内积的算法来重新计算权值矩阵,从而更适合应用于分类问题。应用于人脸识别的实验结果证明,PM-LE算法能很好地完成实际的降维和分类任务。
在分类聚类、信息检索、数据可视化等领域中,发展有效的降维技术,使得高维数据在压缩过程中尽量保持本征几何结构、避免有用信息丢失,一直备受关注。相对而言,现实世界中需要处理的诸如文本、图像、视频等数据,它们的特征空间不是输入空间的一个线性子空间,principal component analysis(PCA)[1]和multidimensional scaling (MDS )等线性方法也不再适用。非线性降维方法包括引入核技术和流形学习等。其中流形学习方法假定输入数据分布或近似分布于嵌入在高维空间中的低维流形上,强调简单的算法实施和避免优化问题收敛于局部最优。 低维流形嵌入在高维输入空间的案例包括代表相同三维空间物体在不同相机视角和光条件下的图像向量,以及语料库中的用于处理特定话题的文档向量等。在这些情况下原始输入空间的维度可能非常高,但本征维度相对有限。Isometric mapping(ISOMAP)[2]和locally linear embedding(LLE)[3]的提出正式开启了非线性流形学习的方向。发展至今,非线性流形学习大致可分为全局特性保持方法和局部特性保持方法。前者在高维输入空间中直接构建代表全局几何结构的全局度量矩阵,接着利用特征分解获得低维嵌入表示,如ISOMAP和maximum variance unfolding(MVU)[4]等;后者首先构建保持局部几何结构的局部度量矩阵,再全局排列局部信息以获得唯一的低维坐标,如LLE、Laplacian Eigenmaps(LE)[5]、Hessian Eigenmaps(HLLE)[6]。
发现流形的结构是一个非常有挑战的无监督问题,其获得的结果只是对应于原始数据集的低维表示,对于解决许多实际问题仍然不够实用,因此后来又衍生出有监督学习、样本外点学习、多流形学习等问题。许多学者针对其进行了改进。YAN 等[7]提出解决流形学习泛化问题的线性化、核化和张量化思想,并给出了一个帮助设计新的降维算法的框架;LEE 等[8]给出了一个利用分布在多个流形上的多个数据集学习其联合低维表示的方法,其中每个数据集被视作通用流形的一个实例。 拉普拉斯特征映射(LE )算法是保持局部特性流形学习方法的一种,locality preserving projection(LPP)[9-10] 算法是其对应的线性版本。本文基于传统的LE 和LPP 算法,引入类别信息帮助构建近邻图,并且利用SCOTT 等[11]提出的最大化相似矩阵及其配对矩阵内积的算法来重新计算权值矩阵,提出一种用于分类的PM-LE 算法。〖HT6〗
1 LE 和LPP LE 的基本思想是使得原始高维空间中的近邻 点投影到本征低维空间后仍为近邻点。BELKIN 等人发现流形上Laplacian-Beltrami 算子的特征.....
基金项目:国家科技支撑计划资助项目(2015IM030300);上海市科技创新行动计划资助项目(16111105802) 作者简介:陈张莉(1992—),女,安徽合肥人,同济大学硕士研究生,主要研究方向为图像与仿真。
(文章来源《机械设计与制造工程》杂志如需详细资料请联系江苏机械门户网客服QQ:2980918915,电话025-83726289)
更多关注,请扫码
|