李宏毅2022课程视频全部以线上视频的形式给出(已经全部录好,你可以选择短时间全部学完),上课时间会直播讲解额外的内容(可以不听)和作业(建议一定要做),目前已更新到作业七。
第七课主要内容是BERT,是在Transformer模型基础上的更进一步,效果出众,现在业界舆情相关业务基本都倒向了BERT,对NLP感兴趣的同学,这个一定要好好学。
-
课程视频:
b站视频号:机器学习手艺人
网址:https://www.bilibili.com/video/BV1Z34y1C7sj?spm_id_from=333.999.0.0
-
Github:课堂和作业课件及基础代码
网址:https://github.com/yaoweizhang/LHY2022-SPRING
作业七需要使用Kaggle和huggingface下载代码、训练数据集、模型等资料,文末也有助教代码和训练数据集的获得方式。
-
作业任务:
BERT问答阅读理解(BERT Question Answering),训练集是10524个文本段落,以及31690个问题和答案,模型目的是根据文本和问题,给出答案,详情见b站作业视频和课件。
-
Kaggle提交地址:
https://www.kaggle.com/competitions/ml2022spring-hw7
截止日期:
2022/05/06 23:59(北京时间),去冲榜吧。
-
评分:学生通过改进代码提高问答准确率,评分对应的准确率如下。
-
QQ交流群:156013866
难易程度 | 精确度 |
simple | Acc >= 0.45139 |
medium | Acc >= 0.65792 |
strong | Acc >= 0.78136 |
boss | Acc >= 0.84388 |
作业七助教代码和数据获得方式:
-
关注微信公众号 “机器学习手艺人”
-
后台回复关键词:202207