parameters | 含义 | 用法 |
---|---|---|
max_depth | 树的最大深度 | 当模型过拟合时,可以考虑降低 |
min_data_in_leaf | 叶子可能具有的最小记录树 | 默认20,过拟合时用 |
feature_fraction | 例如为0.8时,表示每次迭代中随机选择80%的参数来建树 | boosting为random forest时使用 |
bagging_fraction | 每次迭代时用的数据比例 | 用于加快训练速度和减小过拟合 |
early_stopping_round | early_stopping_round回后为改善停止迭代 | 减少迭代次数 |
lambda | 正则化系数 | 0~1 |
min_gain_to_split | 描述分裂的最小gain | 控制树的有用分裂 |
max_cat_group | 在group边界上找到分割点 | 当类别数量很多时,找分割点容易过拟合 |
metric | 评价指标 | mae,mse,binary_logloss, auc等 |
boost | 要用的算法 | gbdt, rf, goss, dart等 |
num_leaves | 叶子数量 | 默认31 |
num_boost_round | 迭代次数 | |
save_binary | 为True时数据集被保存为二进制文件,下次读数据的速度会变快 | |
max_bin | feature将存入的bin的最大数量 | |
lightGBM参数介绍
猜你喜欢
转载自blog.csdn.net/qq_24852439/article/details/88416284
今日推荐
周排行