[获取数据集] 数据分析、机器学习获取开放的数据集
不管数据分析还是机器学习,用真实的数据比用虚拟的数据得出的结果要好,以下是一些比较流行的开放数据存储库,里面有成千上万覆盖各个领域的数据。
流行的开放数据存储库:
- UC Irvine Machine Learning Repository:http://archive.ics.uci.edu/ml/
- Kaggle datasets:https://www.kaggle.com/datasets
- Amazon’s AWS datasets:http://aws.amazon.com/fr/datasets/
- 和鲸社区: https://www.heywhale.com/home
- 国家统计局: http://www.stats.gov.cn/
元门户站点
- Data Portals: http://dataportals.org/
- OpenDataMonitor: http://opendatamonitor.eu/
- Quandl: http://quandl.com/
- Wikipedia’s list of Machine Learning datasets: https://goo.gl/SJHN2k
- The datasets subreddit: https://www.reddit.com/r/datasets
慢慢补充。