lightgbm类别预测的一些问题

lightgbm在作类别预测的时候，有一些不同的使用方法

import lightgbm as lgb

#第一种
estimator=lgb.sklearn.LGBMClassifier()
estimator.fit(x_train,y_train)      #x_train和y_train 是numpy或pandas数据类型即可
pre = estimator.predict(x_test)     #返回的是类别

#-----------------------------------------
#第二种
lgtrain = lgb.Dataset(X_train,label = y_train)

lgb.train(lgtrain)                 #此时的训练数据需要为 lgb的数据类型
pre = lgb.predict(x_test)          #此时返回的是对每类的预测概率,需要自行转化为类
                                   #假设训练数据有N个，类别为n个，则pre是一个N*n的np.array
y_test = np.argmax(pre,axis = 1)   #转化为类别

#-------------------------------------
#在lgb.cv()中，得出的结果仍然是概率，但是这时是一个 Nn*1的np.array,此时转化方法如下
#概率转化为类别，num_class 为类别的种类
pre = np.argmax(pre.reshape(num_class, -1),axis=0)    

#因此 如果需要自定义评价函数，也需要先自行转化
def evalerror(preds, lgtrain):
    from sklearn.metrics import f1_score
    import numpy as np

    preds = np.argmax(preds.reshape(num_class, -1),axis=0)
    label = lgtrain.get_label()
    esult = f1_score(preds,label,average = 'macro')
    return 'f1_score',result,True

lightgbm类别预测的一些问题

猜你喜欢