对The Curse of Dimensionality（维度灾难）的理解 - 代码天地

对The Curse of Dimensionality（维度灾难）的理解

其他 2018-05-12 18:37:08 阅读次数: 1

一个特性：低维（特征少）转向高维的过程中，样本会变的稀疏（可以有两种理解方式：1.样本数目不变，样本彼此之间距离增大。2.样本密度不变，所需的样本数目指数倍增长）。

高维度带来的影响：

1.变得可分。

由于变得稀疏，之前低维不可分的，在合适的高维度下可以找到一个可分的超平面。

2.过拟合风险。

过高维度会带来过拟合的风险（会学习到数据集中的特例或异常，对现实测试数据效果较差）。增加维度的线性模型等效于低维空间里较复杂的非线性分类器。

3.需要更多训练数据。我们需要更多的训练数据进行参数估计。

4.过高维度会让分类变难。

高维下数据更多分布在空间角落（因为单位球占单位立方体下的空间比例随着维度增加，越来越小。处于单位球内的可以看出靠近中心），而角落处的特征更难分，因为距离更大。

5.高维度中用距离来衡量样本相似性的方法已经渐渐失效。

（几乎所有的高维空间都远离其中心，任意两点的距离会趋向收敛，意思是任意两点的最大距离和最小距离会变为相同。因此基于欧式距离的k-means算法，会无法进行聚类（因为距离会趋于收敛）。而K-NN会的临近K个点中，会出现更多非同类的点（远多于低维度的情况）。）

猜你喜欢

转载自www.cnblogs.com/dingz/p/9029395.html

对The Curse of Dimensionality（维度灾难）的理解

机器学习之：维度灾难（Curse of Dimensionality）

维数灾难（The Curse of Dimensionality in classification）

curse of dimensionality 维数灾难的两个表现

Dimensionality and hige dimensional data: definition, examples, curse of..

【动态规划】Mathematical Curse

维度灾难

E2. Unforgivable Curse (hard version)

ACM-ICPC2018焦作网络赛 Mathematical Curse（dp）

icpc2018焦作Mathematical Curse（动态规划）

2018icpc 焦作网络赛 B. Mathematical Curse

Breaking the Curse Gym - 101840B 子串查找

2018焦作网络赛B-Mathematical Curse

机器学习之维度灾难

维度灾难与过拟合（转）

ACM-ICPC 2018 焦作赛区网络预赛 B. Mathematical Curse << DP

ACM-ICPC 2018 焦作赛区网络预赛 B Mathematical Curse —— dp

ACM-ICPC 2018 焦作网络预赛 B - Mathematical Curse（dp）

2018icpc 焦作赛区网络预赛 B Mathematical Curse(dp)

ACM-ICPC 2018 焦作赛区网络预赛 B. Mathematical Curse

B. Mathematical Curse(ACM-ICPC 2018 焦作赛区网络预赛,dp)

ACM-ICPC 2018 焦作赛区网络预赛 B Mathematical Curse(DP)

ACM-ICPC 2018 焦作赛区网络预赛 Mathematical Curse （简单DP+维护极值）

ACM-ICPC 2018 焦作网络赛 B. Mathematical Curse (dp)

ACM-ICPC 2018 焦作赛区网络预赛 B. Mathematical Curse（dp）

ACM-ICPC 2018 焦作赛区网络预赛-B-Mathematical Curse

无法拯救我的菜-----焦作网络赛 B. Mathematical Curse

ACM-ICPC 2018 焦作赛区网络预赛 B-Mathematical Curse

ACM-ICPC 2018 焦作赛区网络预赛 B. Mathematical Curse 动态规划

【dp】ACM-ICPC 2018 焦作赛区网络预赛 - B - Mathematical Curse

今日推荐

周排行

Java基础系列-Java11特性解读

前端面试查漏补缺--(十一) 前端软件架构模式MVC/MVP/MVVM

java Listener监听器

矩阵的迹

运用MVP实现二级联动

019基于JSP的学生考勤管理系统(MySQL版)

一道逻辑题 - 我拿走了哪个数

C# 通用单例窗体类

分布式之消息队列复习精讲【转】

Mac 使用.bash_profile

每日归档

更多

2024-07-11(0)

2024-07-10(0)

2024-07-09(0)

2024-07-08(0)

2024-07-07(0)

2024-07-06(0)

2024-07-05(0)

2024-07-04(0)

2024-07-03(0)

2024-07-02(0)