第11章 启用机器学习的建议
1,决定下一步做什么
模型结果不如意,该怎么办,有很多方法,如上图,但是该选哪个呢?本章教你如何选择。
机器学习诊断
2,评估假设
对于有某种数据的数据,最好是随机选择30%作为测试集。
可以发现,test set error的计算步骤和代价函数有异曲同工之妙。
3,模型选择和训练、验证、测试集
用训练集得到的会比实际的泛化误差低,不能很好地估计训练结果的泛化能力。
训练集,交叉验证集(Cross validation set),测试集
4,诊断偏差与方差
大红色的线代表从欠拟合到正好到过拟合。
区分高偏差(欠拟合)和高方差(过拟合),主要看训练集的误差大小。
5,正则化和偏差、方差
6,学习曲线
高偏差和高方差,学习曲线形状类似,但是高方差的验证集/测试集和训练集的误差差距较大。
7,决定接下来做什么
对待不同情况采取不同措施。
一般是一个隐藏layer,如果想用多个,可以采用一层,两层,三层训练模型,分别计算出交叉验证集的代价函数,看哪个最小。