IsoMap实战

飞熊 • 2023年9月5日下午7:00 • Python • 阅读 347

不管现实多么惨不忍睹，都要持之以恒地相信，这只是黎明前短暂的黑暗而已。不要惶恐眼前的难关迈不过去，不要担心此刻的付出没有回报，别再花时间等待天降好运。真诚做人，努力做事！你想要的，岁月都会给你。IsoMap实战，希望对大家有帮助，欢迎收藏，转发！站点地址：www.bmabk.com，来源：原文

两种经典的非线性降维（Nonlinear Dimensionality Reduction）方法：LLE和IsoMap。实验有很多环节，最有趣的一个环节，是给你698张人脸的图像（64×64灰度），通过isomap降维方法将每张脸当做一个点映到二维平面上，使得横坐标恰好反映人脸左右看的程度，纵坐标反映人脸上下看的程度。
1.实验环境：Matlab6.5

2.实验步骤

步骤一：准备数据集和工具包

下载人脸数据集：http://waldron.stanford.edu/~isomap/face_data.mat.Z

下载isomap算法实现的所有代码：http://waldron.stanford.edu/~isomap/code/

步骤二：

准备图片标记的人脸序号集：一共有698张人脸，都画在平面上太拥挤了，所以选了30个人脸（存入posesSelect.mat的ks向量），选取的准则是：30个人脸的姿态尽量不同，也就是希望画在平面上尽量分散。事实上，face_data.mat数据集中，poses是一个2行698列的矩阵，第j列就是第j张人脸的客观姿态。

绘制客观姿态分布图：

load face_data

load posesSelect

showFacesOnR2(images,poses,ks)

http://lh6.ggpht.com/_iMG9M3S-9Xo/SWXkfHPcWNI/AAAAAAAACBs/otRKwIQ6DMc/s800/image002.gif

步骤三：降维

用Isomap算法将4096维的人脸数据images降维到2维，并绘制在平面上

load face_data

load posesSelect

D=L2_distance(images,images,1);

options.dims = [2];

[Y, R, E] = IsomapII(D, ‘k’, 7, options);

showFacesOnR2(images,Y.coords{1},ks);

http://lh4.ggpht.com/_iMG9M3S-9Xo/SWXkfu3IIOI/AAAAAAAACB0/nbFaLN3X1HM/s800/image004.gif

D是一个距离矩阵，i行j列值表示人脸i和人脸j的距离，这里把一个人脸图像数据当做一个向量，使用2范数定义距离。

IsoMapII是高性能算法，先把D用k=7近邻打成稀疏矩阵，然后用基于斐波那契堆的Dijkstra算法计算最短路，Dijkstra算法用C实现使用并且编译成了.dll文件为了提高效率。计算结果对我们有用的是Y.coords{1}，它保存了降维后的结果，是2行698列的矩阵。

观察计算结果发现，以中间那个正的人脸为中心，他左边的都在向左看，而且越是靠左的转动越明显。同理，他右面的都在向右看、上面的都在向下看、下面的在向上看。与客观姿态分布基本吻合。

3.实验细节：

showFacesOnR2.m

%把头像和姿态坐标画在平面上

function showFacesOnR2(images,poses,ks);

%normalize into 1:1

poses(1,:)=poses(1,:)/range(poses(1,:));

poses(2,:)=poses(2,:)/range(poses(2,:));

%draw all points

scatter(poses(1,:),poses(2,:),12,’o’,’filled’);

xlabel(‘left-right pose’);

ylabel(‘up-down pose’);

hold on

%draw selected points

scatter(poses(1,ks),poses(2,ks),24,’ro’);

hold on

%draw images on selected points

scale = 0.001;

x=zeros(64,64);

for p=1:size(ks,2)

k=ks(p);

for i=1:64

x(:,i)=images((i-1)*64+1:i*64,k);

end

xc=poses(1,k);

yc=poses(2,k);

imshow(xc:scale:xc+64*scale,yc:-scale:yc-64*scale,x);

hold on

end

return

4.实验总结：

高維度的資料往往很難描述、計算，一個常用的方法是假設這些資料並非真的存在於這麼高的維度上，也就是說，可以用一個較低維度的非線性流形

(non-linear manifold) 來模擬這些資料。流形(Manifold) ，一般可以認為是局部具有歐氏空間性質的空間。而實際上歐氏空間就是流形最簡單的實例。像地球表面

這樣的球面是一個稍為複雜的例子。一般的流形可以通過把許多平直的片折彎並粘連而成。

如果這個manifold 的維度夠低，我們就可以在這個低維度的空間上視覺化原先的資料。降維的方法可以概括分成以下三種：

1. 線性方法(Linear methods)

Principal component analysis (PCA)
Singular value decomposition (SVD)
Factor analysis (FA)

2. 非線性對應(Non-linear mappings)

Generative topographic mapping (GTM)
Gaussian process latent variable models (GPLVM)
Neural network methods

3. 逼近法(Proximity)

Multidimensional scaling (MDS)
Isomap
Locally linear embeddings (LLE)

Isomap

Step 1：Isomap的input 是許多高維度的 data ，並把它們當作一個 graph，只要兩個vertex 是鄰居，就會有一條edge 連結，至於鄰居的判定方法可以是K-nearest neighbors 或是用直接距離再取threshold 都可以。

Step 2：接著，利用Floyd’s Algorithm 算出每個vertex 之間的shortest path distances 。

Step 3：最後，把 Step 2 當中的結果當作MMDS的input，就可以得到一個座標軸，利用這個座標軸描述出的data 就是一個低維度的 manifold。

Isomap 的演算法雖然簡單，但確實解決了PCA 或其他linear methods 在non-linear manifold 上遇到的問題，透過”neighbor”的定義，加強了各 data 之間的連結性，而不是只以絕對距離當作衡量的方法。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/163003.html

赞 (0)

0 0

Python

最强的 Python 类型提示技巧：让你的代码更加简洁明了

000101

青莲明月
2025年2月10日
Python

一文快速理解from … import 与 import 语句的使用

000411

小半
2024年3月13日
Python

web应用程序中SQL注入问题

000317

飞熊
2023年3月5日
Python

【IT冷知识】IT冷知识学习（持续汇总更新）

000862

小半
2022年12月19日
Python

Python常用的数据处理函数和模块

000302

小半
2024年1月17日
Python

一篇撩妹Python聊天机器人,你准备好了吗？

000246

python学霸
2024年4月14日
Python

Python中的13个搔操作

000283

小半
2024年2月23日
Python

Python – zip 函数

000339

seven_
2023年2月21日
Python

python字符串前加r、f、u、l 的区别

000355

小半
2024年2月23日
Python

Python中的变量和格式化输出

000731

小半
2022年11月2日
Python

Code Style

000453

小半
2024年3月14日
Python

Python异步编程之web框架异步vs同步数据库IO任务并发支持对比

000289

小半
2023年12月29日

发表回复

登录后才能评论

极客之音——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！