当我们训练网络时需要大量的图片数据,我们可以去开源的imagenet库下载图片,首先我们需要注册ImageNet账号,邮箱需要.edu结尾的邮箱或者别的公司的邮箱,免费的邮箱是不行的。注册还需要翻墙,否则看不到reCAPTCHA验证码。注册后再登录搜索需要的图片标注,比如说dog。然后选择下载链接存在.txt文件里,最后就是编写Python3脚本编写啦
from urllib import request
#import urllib2, urllib
import signal
path ='C:/Users/Administrator/Desktop/text.txt' #保存的.txt文件
paths='C:/Users/Administrator/Desktop/r_g_pic/' 图片下载保存的地址
file = open(path,'r')
i=1004
for line in file:
try:
paths='C:/Users/Administrator/Desktop/r_g_pic/'
paths=paths+str(i)+'.jpg'
request.urlretrieve(line,paths)
print(i)
i=i+1
except:
print("%s timeout " % line)
pass
file.close()
你也可以使用多线程下载这样会下载更快。完成后就可以看见很多图片啦!!!