机器学习中的数据简介

数据是机器学习领域的重要组成部分。它指的是可用于训练机器学习模型的一组观察或测量。可用于训练和测试的数据的质量和数量在确定机器学习模型的性能方面起着重要作用。数据可以采用各种形式,例如数字、分类或时间序列数据,并且可以来自各种来源,例如数据库、电子表格或 API。机器学习算法使用数据来学习输入变量和目标输出之间的模式和关系,然后可以将其用于预测或分类任务。

数据通常分为两种类型: 

  1. 标记数据
  2. 未标记数据

标记数据包括模型试图预测的标签或目标变量,而未标记数据不包括标签或目标变量。机器学习中使用的数据通常是数字或分类数据。数字数据包括可以排序和测量的值,例如年龄或收入。分类数据包括表示类别的值,例如性别或水果类型。

猜你喜欢

转载自blog.csdn.net/tianqiquan/article/details/130170787