数据挖掘-公开数据集的合集

  • AWS (Amazon Web Server) Public datasets 亚马逊公用数据集 :过去,查找、下载、自定义和分析卫星图像或基因组数据等大型数据集需要几个小时或几天的时间。当数据在 AWS 上公开提供后,任何人都可以分析任意数量的数据,而无需自行下载或存储这些数据。包括:地理空间和环境数据集、基因组和生命科学数据集、机器学习数据集、监管和统计数据。
  • BigML : BigML提供一个建立和共享数据集和模型的管理平台,能够利用现有的云计算解决方案是它的优势。BigML只专注于机器学习,提供了一套更广泛的功能,这些功能都集成在一个可用的Web UI上。你可以加载数据集,训练和评估你的模型,并生成新的预测(无论逐一或成批)。
  • BioAssay Research Database 生物鉴定研究数据库 : BASD是功能强大的新生物数据库,来自美国国立卫生研究院分子库项目。现在,科学家可以以前所未有的效率来开发和测试假设不同化学探测器对生物学功能的影响。
  • Bitly : bit.ly 向用户提供了查看被缩短网址的点击量等的统计。可以使用bitly来统计政府公共网址(如1.usa.gov等)的匿名点击量。
  • Canada Open Data 加拿大政府公开的数据 : 有关加拿大政府服务,财务,国家人口信息或高分辨率地图(卫星地图)的数据。
  • Causality Workbench 因果工作台 :该项目的目的是提供一个测试机器学习和因果发现算法的环境。该平台的库拥有许多各种行业的数据集和软件包。虚拟实验室允许用户设计虚拟实验来研究人为因果系统。
  • Data.gov : 美国政府的公开数据网站。包括农业、气候、消费、生态、教育、能源、财政、医疗、工业、政府、海事、海洋、公共安全、科学研究等数据。

来源:70+ websites to get large data repositories for free

猜你喜欢

转载自blog.csdn.net/sriting/article/details/76285917