记录数据比赛历程(一)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_39622065/article/details/81458595

昨天开始入坑的比赛,18/8/5  去掉了标准差接近0的特征,使用XGBoot筛选出了前50个重要特征,进行了过采样,提交的最好结果:66 排名118

2018/8/6

今天开始做特征,记录一下

从原始数据中增加了

pve_win_pro:pve的获胜率

pvp_win_pro:pvp的获胜滤

acceleration_add:所有加速药水的获取量

acceleration_reduce:所有加速药水的使用量

acceleration_remd:剩余的加速药水

ave_once_money:每次充钱的数量

2018/8/7

今天推翻了之前的推论

重新做了特征,通过和群里大佬讨论发现了注册时间还是有用的,便又重新拾起了时间这个特征

惊奇的发现RMSE降低了4。。 今日最好64  排名49

对代码进行了优化,整理了一下逻辑

然后有发现了大于1w的数据尤为重要,等待进一步分析

2018/8/8

额,奥运会10周年了,老了老了。。

今天XGBoot破天荒的跑到了62 排名20+ ,证明了1w的数据对结果影响很大,打算再拾起被抛弃的特征,看看有没有啥用吧。

2018/8/9

跑到了60,排名20,和大佬组队了,大佬开源了baseline这几天整理整理,感觉提升不了。。

待续。。

猜你喜欢

转载自blog.csdn.net/qq_39622065/article/details/81458595