版权声明:本文为原创博客,未经允许,请勿转载。 https://blog.csdn.net/u013095333/article/details/83752636
下载kaggle数据集
在kaggle上下载数据集需要使用kaggle给定的API,在shell中进行命令操作即可下载
首先,需要安装pip
然后,安装kaggle,使用如下命令:
pip install kaggle
之后,注册并登陆kaggle网站,在my account
中,下载对应需要的kaggle.json
文件,如下图:
登录后找到对应的my account
找到下载文件对应的地方
下载文件完成。
在linux中,需要将对应的kaggle.json 文件放置在~.kaggle目录下,之后便可以执行命令下载需要的文件了,执行的命令如下,我要下载的是kdd2012的数据集,命令在对应页面会提供:
使用命令即可下载文件,但是国内下载一般巨慢!!!
核心-使用服务器加速
本人有一个搬瓦工服务器,节点在洛杉矶,由于在本地的速度基本为0,不得已使用服务器下载至服务器,再通过FTP服务下载到本地。
实验证明:境外节点下载数据超级快,回传本地相对来讲,也是很不错的!