纪念第二块Kaggle金牌

toxic比赛结束了,有些累,本来是懒得写东西的。因为刚看了一部让人心酸的韩剧,突然有了写点东西纪念的想法。

toxic有害文本检测分类比赛是一个典型的多标签的文本分类比赛,没想到居然吸引了4600多个参赛队参加比赛,竞争非常激烈。0.0001的得分差距,足以让你的排名掉个十几位。所以,从参加比赛后的大半时间我们队都是在银牌区一点点地往上爬,直到比赛结束前十几天才冲到了金牌区。到最后,非常惊险地保住了金牌。

在这里要特别感谢我的队友们,没有你们的辛勤工作,就没有这块金牌了。在比赛过程中,为了减少过拟合带来的巨大风险,我们队采用stacking模型的方式提升得分。为此,我们一共堆了80个不同的模型,本地cv 0.9927左右,lb 0.9879,私有lb 0.9874.   stacking模型不是很完美,仍然有改进的余地。

比赛经验总结帖子:

https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge/discussion/52564

比赛的一些小花絮:

1)世界排名第一的GIBA和排名第二的bestfitting都参赛了。其中,GIBA以组队的方式参加,bestfitting仍然是solo参赛,佩服。

2)GIBA被某大师狂喷,说GIBA是个喜欢"摘桃子"的家伙。

3)GIBA的队最后本来能拿金牌的。但是,因为队友违规(多账号),整个队的成绩取消了。GIBA郁闷地只想喝酒...  : )

Kaggle确实是个好玩的地方。 以上。

猜你喜欢

转载自my.oschina.net/qinhui99/blog/1648775