关于R-Squre应用的8个建议

摘要

1. 不要根据r平方得出一个模型是“好”的结论

2. 使用r²来计算整体的适合度, 如果预测值和真实值强关联，那么r2评估还是不错的。

3. 画图: 异常值会导致r2异常。

4. r2大于0.9，需要查看是否特征变量中包含了因变量强相关的特征，这个特征很有可能有问题。

5. 结合真实情况，有的情况下r2不会很高，特征不足，欠拟合。

6. 考虑因果关系,r2低，在某些情况也是有效的。比如汇率预测，只要假设合理即可。

7. 不要用r2比较模型

8. 不要把伪r平方统计解释为方差

正文

如果你读了这篇文章，希望你对r²统计量有一个基本的概念。r²统计是一个介于0和1之间的数字，或0%和100%之间的数字，它量化了统计模型中解释的方差。不幸的是，R²有很多不同的名字。也就是r-squared, R-square, the coefficient of determination, variance explained, the squared correlation, r2, and R2.

我们从Q和Displayr的用户那里得到了相当多关于它的解释的问题，所以我利用这个机会回答最常见的问题，作为使用R2的一系列技巧。继续读下去，了解更多关于使用r²计算整体拟合的信息，为什么在解释r²时绘制数据是一个好主意，如何解释r²值，以及为什么不应该使用r²来比较模型。

1. 不要根据r平方得出一个模型是“好”的结论
人们在使用r²时犯的最基本的错误是试图根据模型的价值来判断模型是否“好”。这个问题有两个方面:

“我的r²是75%。是,好吗?”
“我的r平方只有20%;我被告知需要达到90%。”
这两个问题的问题在于根据r²统计量来判断模型的好坏有点愚蠢。当然，如果你可以通过r²来检验一个模型，那就太好了，但这样做毫无意义。这篇文章的其余部分解释了原因。

我将对这个技巧提出一个警告。建立经验法则是很常见的。例如，在驾驶员分析中，模型的R-Squared值通常在0.20到0.40之间。但是，记住，即使你在做驱动分析，r²在这个范围内，或者更好，也不能使模型有效。继续读下去，了解更多关于如何理解R平方的内容。

2. 使用r²来计算整体的适合度
有时人们把第一点看得更远，认为r²总是不好的。或者，对于特殊类型的模型(例如，不要在非线性模型中使用R-Squared)来说，它是不好的。这是一个把婴儿连同洗澡水一起倒掉的例子。这里有很多需要注意的地方，但作为总结一段关系强度的一般统计数据，r平方是非常棒的。在其他条件相同的情况下，解释95%方差的模型很可能比解释5%方差的模型好得多，而且很可能会产生更好得多的预测。

当然，通常情况下并非所有人都是平等的，所以请继续阅读。

3.图的数据
当解释r²时，把数据绘制出来几乎总是一个好主意。也就是说，创建观察数据和数据的预测值的图。这可以揭示r²是高度误导的情况。例如，如果观测值和预测值不是围绕直线形成的云，那么r²和模型本身就会产生误导。类似地，异常值可能会使R-Squared统计数据被夸大，或者比描述数据中的整体模式所适合的要小得多。

4. 如果看到值为0.9或更高，请非常害怕
在25年建立模型的过程中，从零售企业ipo到药物测试，从未见过一个r平方超过0.9的好模型。如此高的值总是意味着出了问题，通常是严重的问题.

5. 考虑环境因素

好的r²值是多少?你需要把背景考虑进去。有许多不同的因素可以导致价值的高或低。这使得仅仅根据r²的值来判断一个模型的好坏是很危险的。例如:

当你的预测变量或结果变量是分类的(例如，评级量表)或计数时，r²通常会低于真正的数字数据。
数据中真实的噪音越多，r²值越低。例如，如果根据人们的偏好建立模型，就会有很多噪音，所以很难实现高r平方。相比之下，天文现象的模型正好相反。
当你观察到更多的时候，r²会变小。
当你有更多的预测变量时，r²会变高(这被之前的点所抵消;观测值与预测变量的比率越低，r²值就越高)。
如果你的数据不是一个简单的随机样本，r²可能会被夸大。例如，考虑基于时间序列数据或地理数据的模型。这些很少是简单的随机样本，往往会得到更高的r²统计量。
当你的模型排除了明显重要的变量时，r²必然会很小。例如，如果你有一个模型关注品牌形象如何驱动品牌偏好，而你的模型忽略了价格、分销、口味和质量等实际因素，那么即使你的模型很好，r平方也不可避免地会很小。
基于聚合数据(如州级数据)的模型比基于病例级数据的模型具有更高的R-Squared统计量。
6. 仔细思考因果关系
要使r²在绝大多数应用中有任何意义，这个模型必须能说明一些关于因果关系的有用信息。例如，考虑一个基于体重预测成年人身高的模型，得到的r²为0.49。这样的模型有意义吗?这取决于语境。但是，对于大多数情况，该模型不太可能有用。如果我们让成年人吃得更多，他们就会长高，这种暗示很少是真的。

但是，考虑一个预测明天汇率的模型，其r²为0.01。如果该模型在其因果假设方面是合理的，那么很有可能该模型足够准确，使其所有者非常富有。

7. 不要用r²来比较模型
一个很自然的事情是根据r平方统计来比较模型。如果一个模型的r²值更高，它肯定更好吗?一般来说，这是个糟糕的想法。这有两个不同的原因:

在许多情况下，当不同模型之间进行比较时，r平方是误导的。例如，比较基于聚合数据的模型与基于非聚合数据的模型，或者变量被转换的模型。
即使在r平方可能有意义的情况下，也总有更好的工具来比较模型。这些包括f检验、贝叶斯因子、信息标准和样本外预测精度。
8. 不要把伪r平方统计解释为方差
从技术上讲，r²只适用于有数字数据的线性模型。虽然我发现它对很多其他类型的模型都很有用，但很少看到它用于使用分类结果变量的模型(例如，logit模型)。许多伪r平方模型已经被开发出来用于这一目的(例如，麦克法登的Rho, Cox和Snell)。它们是用来模拟r²的0代表坏模型，1代表好模型。然而，它们与r²有根本的不同，因为它们不表示由模型解释的方差。例如，如果麦克法登的Rho是50%，即使是线性数据，这并不意味着它解释了50%的方差。这种解释是不可能的。特别是，即使模型是“完美的”，这些统计数据中的许多永远不会达到1.0的值。

关于R-Squre应用的8个建议

摘要

正文

猜你喜欢