机器学习很多时候需要估计某个算法在未知数据上的性能。
置信区间是一种对估计不确定性的量化方法,它们可以用来在总体参数(例如平均值mean,就是从总体中的一个独立观测样本上估计而来)上添加一个界限或者可能性。
在这篇教程中,你会了解置信区间以及如何在实践中计算置信区间。
学完本教程后,你会明白:
置信区间是总体参数估计的一个界限
我们可以直接计算分类方法估计能力的置信区间
任意总体统计的置信区间都可以用bootstrap以一种分布无关法(distribution-free)进行估计
我们开始吧。