传统机器学习分类器选型

NB -优势
实现简单、训练速度快
适应不同量级的数据
支持增量式训 练
可解释性强
NB -劣势
需假设条件独立
难以处理特征组

DT -优势
计算复杂度不高
有效处理连续特征
适合小规模数据
可解释性强
DT -劣势
不擅长对数值结果进行预测 不擅长对数值结果进行预测 不擅长对数值结果进行预测
不支持增量式训练
容易出现过拟合
 

KNN -优势
可用复杂函数进行值预测
对噪声数据不敏感
支持增量式训练
可解释性强
KNN -劣势
存在样本不均衡问题
K值选取对结果影响大
计算量大、内存消耗需要完整的训练数
需要完整的训练数据

SVM -优势
适合大规模数据
有效处理连续特征
泛化错误率低
结果可解释性强
SVM -劣势
核函数及相关参难以确定
原始分类器不支持多分类
内存消耗大,计算时多
过程可解释性差

LR -优势
适合传统机器学习范畴内的大规模数据
计算快、存储消耗少
支持增量式训练
可解释性强
LR -劣势
容易欠拟合
分类精度可能不高
只能解决线性问题


 

猜你喜欢

转载自blog.csdn.net/zyp361161/article/details/87542313