lightGBM参数介绍

parameters 含义 用法
max_depth 树的最大深度 当模型过拟合时,可以考虑降低
min_data_in_leaf 叶子可能具有的最小记录树

默认20,过拟合时用

feature_fraction 例如为0.8时,表示每次迭代中随机选择80%的参数来建树 boosting为random forest时使用
bagging_fraction 每次迭代时用的数据比例 用于加快训练速度和减小过拟合
early_stopping_round early_stopping_round回后为改善停止迭代 减少迭代次数
lambda 正则化系数 0~1
min_gain_to_split 描述分裂的最小gain 控制树的有用分裂
max_cat_group 在group边界上找到分割点 当类别数量很多时,找分割点容易过拟合
metric 评价指标 mae,mse,binary_logloss, auc等
boost 要用的算法 gbdt, rf, goss, dart等
num_leaves 叶子数量 默认31
num_boost_round 迭代次数  
save_binary 为True时数据集被保存为二进制文件,下次读数据的速度会变快  
max_bin feature将存入的bin的最大数量  
     

猜你喜欢

转载自blog.csdn.net/qq_24852439/article/details/88416284