第二十八章:
绘制学习曲线。随着训练集的增加,错误率逐渐的减少。
第二十九章:
绘制训练误差曲线。随着训练集大小的增加,开发集(和测试集)误差应该会降低,但你的训练集误差往往会同时增加。
第三十章:
高偏差:
-
随着我们添加更多的训练数据,训练误差只会变得更糟。因此蓝色的训练误差曲线只会保持不动或上升,这表明它只会远离期望的性能水平(绿色的线)。
-
红色的开发误差曲线通常要高于蓝色的训练误差曲线。因此只要训练误差高于期望性能水平,通过添加更多数据来让红色开发误差曲线下降到期望性能水平之下也基本没有可能。
第三十一章:
蓝色训练误差曲线相对较低,红色的开发误差曲线比蓝色训练误差高得多。因此,偏差很小,但方差很大。添加更多的训练数据可能有助于缩小开发误差和训练误差之间的差距。
下图 这种情况下训练误差很大,因为它比期望的性能水平要高得多。开发误差也比训练误差大得多,因此有着明显的偏差和方差。此时你必须找到一种方法来减少算法中的偏差和方差。
第三十二章:
绘制学习曲线