关于R-Squre应用的8个建议

摘要

1. 不要根据r平方得出一个模型是“好”的结论

2. 使用r²来计算整体的适合度, 如果预测值和真实值强关联,那么r2评估还是不错的。

3. 画图: 异常值会导致r2异常。

4. r2大于0.9,需要查看是否特征变量中包含了因变量强相关的特征,这个特征很有可能有问题。

5. 结合真实情况,有的情况下r2不会很高,特征不足,欠拟合。

6. 考虑因果关系,r2低,在某些情况也是有效的。比如汇率预测,只要假设合理即可。

7. 不要用r2比较模型

8. 不要把伪r平方统计解释为方差

正文

如果你读了这篇文章,希望你对r²统计量有一个基本的概念。r²统计是一个介于0和1之间的数字,或0%和100%之间的数字,它量化了统计模型中解释的方差。不幸的是,R²有很多不同的名字。也就是r-squared, R-square, the coefficient of determination, variance explained, the squared correlation, r2, and R2.

我们从Q和Displayr的用户那里得到了相当多关于它的解释的问题,所以我利用这个机会回答最常见的问题,作为使用R2的一系列技巧。继续读下去,了解更多关于使用r²计算整体拟合的信息,为什么在解释r²时绘制数据是一个好主意,如何解释r²值,以及为什么不应该使用r²来比较模型。

1. 不要根据r平方得出一个模型是“好”的结论
人们在使用r²时犯的最基本的错误是试图根据模型的价值来判断模型是否“好”。这个问题有两个方面:

“我的r²是75%。是,好吗?”
“我的r平方只有20%;我被告知需要达到90%。”
这两个问题的问题在于根据r²统计量来判断模型的好坏有点愚蠢。当然,如果你可以通过r²来检验一个模型,那就太好了,但这样做毫无意义。这篇文章的其余部分解释了原因。

我将对这个技巧提出一个警告。建立经验法则是很常见的。例如,在驾驶员分析中,模型的R-Squared值通常在0.20到0.40之间。但是,记住,即使你在做驱动分析,r²在这个范围内,或者更好,也不能使模型有效。继续读下去,了解更多关于如何理解R平方的内容。

2. 使用r²来计算整体的适合度
有时人们把第一点看得更远,认为r²总是不好的。或者,对于特殊类型的模型(例如,不要在非线性模型中使用R-Squared)来说,它是不好的。这是一个把婴儿连同洗澡水一起倒掉的例子。这里有很多需要注意的地方,但作为总结一段关系强度的一般统计数据,r平方是非常棒的。在其他条件相同的情况下,解释95%方差的模型很可能比解释5%方差的模型好得多,而且很可能会产生更好得多的预测。

当然,通常情况下并非所有人都是平等的,所以请继续阅读。

3.图的数据
当解释r²时,把数据绘制出来几乎总是一个好主意。也就是说,创建观察数据和数据的预测值的图。这可以揭示r²是高度误导的情况。例如,如果观测值和预测值不是围绕直线形成的云,那么r²和模型本身就会产生误导。类似地,异常值可能会使R-Squared统计数据被夸大,或者比描述数据中的整体模式所适合的要小得多。

4. 如果看到值为0.9或更高,请非常害怕
在25年建立模型的过程中,从零售企业ipo到药物测试,从未见过一个r平方超过0.9的好模型。如此高的值总是意味着出了问题,通常是严重的问题.

5. 考虑环境因素

好的r²值是多少?你需要把背景考虑进去。有许多不同的因素可以导致价值的高或低。这使得仅仅根据r²的值来判断一个模型的好坏是很危险的。例如:

当你的预测变量或结果变量是分类的(例如,评级量表)或计数时,r²通常会低于真正的数字数据。
数据中真实的噪音越多,r²值越低。例如,如果根据人们的偏好建立模型,就会有很多噪音,所以很难实现高r平方。相比之下,天文现象的模型正好相反。
当你观察到更多的时候,r²会变小。
当你有更多的预测变量时,r²会变高(这被之前的点所抵消;观测值与预测变量的比率越低,r²值就越高)。
如果你的数据不是一个简单的随机样本,r²可能会被夸大。例如,考虑基于时间序列数据或地理数据的模型。这些很少是简单的随机样本,往往会得到更高的r²统计量。
当你的模型排除了明显重要的变量时,r²必然会很小。例如,如果你有一个模型关注品牌形象如何驱动品牌偏好,而你的模型忽略了价格、分销、口味和质量等实际因素,那么即使你的模型很好,r平方也不可避免地会很小。
基于聚合数据(如州级数据)的模型比基于病例级数据的模型具有更高的R-Squared统计量。
6. 仔细思考因果关系
要使r²在绝大多数应用中有任何意义,这个模型必须能说明一些关于因果关系的有用信息。例如,考虑一个基于体重预测成年人身高的模型,得到的r²为0.49。这样的模型有意义吗?这取决于语境。但是,对于大多数情况,该模型不太可能有用。如果我们让成年人吃得更多,他们就会长高,这种暗示很少是真的。

但是,考虑一个预测明天汇率的模型,其r²为0.01。如果该模型在其因果假设方面是合理的,那么很有可能该模型足够准确,使其所有者非常富有。

7. 不要用r²来比较模型
一个很自然的事情是根据r平方统计来比较模型。如果一个模型的r²值更高,它肯定更好吗?一般来说,这是个糟糕的想法。这有两个不同的原因:

在许多情况下,当不同模型之间进行比较时,r平方是误导的。例如,比较基于聚合数据的模型与基于非聚合数据的模型,或者变量被转换的模型。
即使在r平方可能有意义的情况下,也总有更好的工具来比较模型。这些包括f检验、贝叶斯因子、信息标准和样本外预测精度。
8. 不要把伪r平方统计解释为方差
从技术上讲,r²只适用于有数字数据的线性模型。虽然我发现它对很多其他类型的模型都很有用,但很少看到它用于使用分类结果变量的模型(例如,logit模型)。许多伪r平方模型已经被开发出来用于这一目的(例如,麦克法登的Rho, Cox和Snell)。它们是用来模拟r²的0代表坏模型,1代表好模型。然而,它们与r²有根本的不同,因为它们不表示由模型解释的方差。例如,如果麦克法登的Rho是50%,即使是线性数据,这并不意味着它解释了50%的方差。这种解释是不可能的。特别是,即使模型是“完美的”,这些统计数据中的许多永远不会达到1.0的值。

猜你喜欢

转载自blog.csdn.net/lpfangle/article/details/124409638