机器学习应用
•分类或预测趋势:自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题现在可以直接由数据本身得出结论。
•发现事物之间的关系:数据关联是一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。
•按特征自动归类:数据库中的记录可被划分为一系列有意义的子集,例如:聚类。
•异常值检测:数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。
机器学习任务的三大前提
•现象的背后有一个潜在的模式或规律
•想要解决的问题必须要有潜在的模式或规律,机器学习才能发挥作用。
•能不能用机器学习的算法预测下一次骰子会出现几?
•这个模式或规律很难用数学公式定义
• 如果某个问题有明确的公式或很容易就能定义它的特征,那就没必要使用机器学习了。回归分析属于机器学习吗?
•有足够多的数据
• 机器学习是从数据出发的,没有数据机器也就没办法学到任何技能,所以一些数量的数据是必须的。