- t-SNE – Laurens van der Maaten(感谢学术男神们的无私开源)
- User_guide.pdf(用户指南)
1. tsne 函数
mappedX = tsne(X, labels, no_dims, init_dims, perplexity)
- 最新的matlab(实测的是2017b) 已经集成了 tsne
- tsne 是无监督降维技术,labels 选项可选;
- X是由N 个样本组成的二维矩阵,每个样本由 D 维数据构成(N行D列);
- no_dims 的默认值为 2;(压缩后的维度)
- tsne 函数实现,X∈RN×D⇒RN×no_dimesX∈RN×D⇒RN×no_dimes(mappedX)
init_dims
:注意,在运行 tsne 函数之前,会自动使用 PCA 对数据预处理,将原始样本集的维度降低至init_dims
维度(默认为 30)。因此用户可以自行设置一下init-dims的数量。或者提前使用matlab中的PCA检测一下哪个维度能够保持你的样本数据的正确率。- perplexity:高斯分布的perplexity,默认为 30; 此参数不了解,但是教程中说,越是高密度的样本,其值越大。一般推荐5-50
2.Plot results 输出结果
gscatter(mappedX(:,1), mappedX(:,2), train_labels);
3. mnist 数据集可视化
- mnist 的 mat 文件,下载地址,mnist.zip