集成算法

概念:各种模型融合,结果取平均值或投票等
项目经验:输出每个模型预测结果的情况,剔除预测效果差的模型(例如预测正样本比率是否符合原数据集正样本比率)
Stacking(堆叠)模型:第一阶段最好交叉验证
优点:使模型的边界更加平稳,效果更好,过拟合风险更低
缺点:消耗时间大,不适合实时处理,只适合离线操作

转载本博笔记须在文章明显处注明原文的链接和作者信息 

猜你喜欢

转载自www.cnblogs.com/yinghuali/p/9253437.html