用R语言对高维数据进行降维聚类展示
【为什么要降维】*维数灾难:在给定精度下,准确地对某些变量的函数进行估计,所需样本量会随着样本维数的增加而呈指数形式增长。*降维的意义:克服维数灾难,获取本质特征,节省存储空间,去除无用噪声,实现数据可视化强烈推荐几篇博客:https://www.douban.com/note/469279998/http://bindog.github.io/blog/2016/06/04/f
1.为什么要降维
*维数灾难:在给定精度下,准确地对某些变量的函数进行估计,所需样本量会随着样本维数的增加而呈指数形式增长。
*降维的意义:克服维数灾难,获取本质特征,节省存储空间,去除无用噪声,实现数据可视化
2.强烈推荐几篇博客:
https://www.douban.com/note/469279998/
http://bindog.github.io/blog/2016/06/04/from-sne-to-tsne-to-largevis
http://blog.sina.com.cn/s/blog_594168770102wbsn.html
http://blog.csdn.net/brunowuestelle/article/details/46698241
http://blog.sina.com.cn/s/blog_b623d3f40102v2zg.html
我降维的目的很单纯,就是为了可视化,因为高维数据无法展示。
代码我就不贴了,自己百度去吧(可以先看看我推荐的这几篇博客),哈哈。不过我可以提醒一下,t-SNE降维效果比PCA好太多了,应该是目前降维效果最好的算法了。
3d作图包:rgl
最后贴几张聚类效果图
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)