转载自:http://blog.sina.com.cn/s/blog_6a1bf1310101habg.html
Locally linear embedding (LLE) (Sam T.Roweis and Lawrence K.Saul, 2000)以及Supervised locally linear embedding (SLLE) (Dick and Robert, 2002) 是最近提出的非线性降维方法,它能够使降维后的数据保持原有拓扑结构。
图1 非线性降维实例:B是从A中提取的样本点(三维),通过非线性降维
算法(LLE),将数据映射到二维空间中(C)。从C图中的颜色可以看出
通过LLE算法处理后的数据,能很好的保持原有数据的邻域特性
1 LLE算法
(1)寻找每个样本点的k个近邻点;
(2)由每个样本点的近邻点计算出该样本点的局部重建权值矩阵;
(3)由该样本点的局部重建权值矩阵和其近邻点计算出该样本点的输出值。
具体的算法流程如图2所示。
图2 LLE算法流程
其中 为
的k个近邻点,
是
与
之间的权值,且要满足条件:
。这里求取W矩阵,需要构造一个局部协方差矩阵
。
相结合,并采用拉格朗日乘子法,即可求出局部最优化重建权值矩阵:
可能是一个奇异矩阵,此时必须正则化
,如下所示:
其中r是正则化参数,I是一个kxk的单位矩阵。
其中,为损失函数值,
是
的输出向量,
是
的k个近邻点,且要满足两个条件,即:
其中I是的单位矩阵。这里的
可以存储在
的稀疏矩阵W中,当
是
的近邻点时,
,否则,
。则损失函数可重写为:
要使损失函数值达到最小, 则取Y为M的最小m个非零特征值所对应的特征向量。在处理过程中,将M的特征值从小到大排列,第一个特征值几乎接近于零,那么舍去第一个特征值。通常取第间的特征值所对应的特征向量作为输出结果。
2 SLLE算法
其中是计算后的距离;
在本文中是定义为dijkstra距离;
是表示类与类之间的最大dijkstra距离;
取0或者1,当两点属于同类时,
取为0,否则取1;
是控制点集之间的距离参数,
是一个经验参数。当
取为零时,此时的SLLE和LLE算法相同。
3 SLLE参数设置
。k的选取在算法中起到关键因素,如果k取值太大,LLE不能体现局部特性,使得LLE算法趋向于PCA算法;反之取得太小,LLE便不能保持样本点在低维空间中的拓扑结构。本文中k没有作出进一步的改进,相当于一个经验参数,预先取值为12。
,可以通过如下式子求出该样本点的输出维数。
其中为
的特征值,且以从大到小排列。对于每个样本点,都需要计算一次样本点的输出维数。所有点输出维数的平均值规定为样本的输出维数。
矩阵,此时正则化参数采取如下式子:
是一个经验参数。在求取点间的距离时,
可以增加不同类点之间的距离,从而增加类类之间的距离。
4 SLLE的测数数据处理
,训练样本的输出为
,
为训练样本的维数,m为训练样本的输出维数,N为训练样本的个数。设
为测试样本的集合。主要算法分为三步:
(1)选取一个,将x加入X矩阵中,则X变为
的矩阵。在训练样本中寻找
的k个近邻点,此时还时采用dijkstra距离,但是不能像SLLE算法那样加上样本点的类别信息。
参考文献:
[1] Sam T. Roweis and Lawrence K. Saul. Nonlinear Dimensionality Reduction by Locally Linear Embedding, Science, Dec 22 2000:2323-2326
[2] Lawrence K.Saul, Sam T.Roweis. An Introduction to Locally Linear Embedding. http://www.cs.toronto.edu/~roweis/lle/, 2001
[3] Lawrence K.Saul, Sam T.Roweis. Think Globally, Fit Locally: Unsupervised Learning of Low Dimensional Manifolds. Journal of Machine Learning Research 4(2003) 119-155
[4] Dick de Ridder, Olga Kouropteva, Oleg Okun, et al. Supervised locally linear embedding. Artificial Neural Networks and Neural Information Processing, ICANN/ICONIP 2003 Proceedings, Lecture Notes in Computer Science 2714, Springer, 333-341
[5] Kouropteva O, Okun O & Pietik?inen M. Classification of handwritten digits using supervised locally linear embedding algorithm and support vector machine. Proc. of the 11th European Symposium on Artificial Neural Networks (ESANN’2003), April 23-25, Bruges, Belgium, 229-234
[6] Kouropteva O, Okun O & Pietik?inen M. Supervised Locally Linear Embedding Algorithm for Pattern Recognition. IbPRIA 2003: 386-394
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/162999.html