版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/huanghaocs/article/details/77921810
说明
这里给出了常用的自然语言处理任务的数据集以及一些语料库的链接下载,分中英文两个方面。大部分是电商评论类的数据。
英文数据集
Web data: Amazon reviews
https://snap.stanford.edu/data/web-Amazon.html
http://jmcauley.ucsd.edu/data/amazon/
Restaurant Reviews Dataset
http://www.cs.cmu.edu/~mehrbod/RR/
Movie Review Data
http://www.cs.cornell.edu/people/pabo/movie-review-data/
中文数据集
Amazon.cn Dataset:https://sites.google.com/site/homecxu/dataset
自然语言处理与信息检索共享平台:http://www.nlpir.org/?action-category-catid-28
电商评论:http://yongfeng.me/dataset/
GitHub Chinese Dataset
https://github.com/Lab41/sunny-side-up/wiki/Chinese-Datasets