1.2 数据获取
李沐
B站:https://space.bilibili.com/1567748478/channel/collectiondetail?sid=28144
课程主页:https://c.d2l.ai/stanford-cs329p/
1. 数据如何获取
- 是不是有足够多的数据?
- 如果有:数据处理
- 如果没有:是否能找数据,数据源?
- 是: 发现数据、合并数据
- 否:能否生成数据或生成数据的方法?
- 有:生成数据
当没有足够的数据时,我们可以尝试寻找额外的其他数据,并整合到一起作为数据集。
如果没有办法获得其他额外的数据,我们还可以使用数据生成方法来增加数据,比如:数据增强(旋转、拉伸等)以及使用 GAN 来生成相似的数据(这就要考虑成本的问题)。
- 如何找到可用的数据集
- 确实存在数据集,学术论文、会议、比赛
- 找个基准的数据集评估性能:调优:数据集多样化;深度网络结构:大规模数据集