机器学习之邹博笔记1

1、机器学习分为两部分：建模和预测

建模：根据已有数据（文本，图像，声音等）并可能有标记值，提取出数据中的特征向量，使用某一个机器学习算法（最小二乘法），对模型进行训练得出模型。

预测：现有新数据（文本，图像，声音等）并可能有标记值，提取出数据中的特征向量，根据模型对新的数据进行预测。

2、整体看机器学习就是模仿人识别事物的过程即：学习、提取特征、识别、分类

由于机器不能跟人类思维一样根据事物特征自然而然的选择分类方法，所以机器学习方法的选择依然还需要人工选择。目前，机器学习的方法主要有三种：监督学习、半监督学习和无监督学习。监督学习是利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程。白话一点，就是根据已知的，推断未知的。代表方法有：Nave Bayes、SVM、决策树、KNN、神经网络以及Logistic分析等；半监督方法主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题，也就是根据少量已知的和大量未知的内容进行分类。代表方法有：最大期望、生成模型和图算法等。无监督学习是利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程。也就是及其自个儿学。代表方法有：Apriori、FP树、K-means以及目前比较火的Deep Learning。从这三方面看，无监督学习是最智能的，有能实现机器主动意识的潜质，但发展还比较缓慢；监督学习是不太靠谱的，从已知的推断未知的，就必须要把事物所有可能性全都学到，这在现实中是不可能的，人也做不到；半监督学习是“没办法中的办法”，既然无监督学习很难，监督学习不靠谱，就取个折中，各取所长。目前的发展是，监督学习技术已然成熟，无监督学习还在起步，所以对监督学习方法进行修改实现半监督学习是目前的主流。但这些方法基本只能提取信息，还不能进行有效的预测。来源：https://www.cnblogs.com/xpNLP/p/4678636.html

3、邹博将机器学习流程比作西红柿炒蛋
这里写图片描述

4、清晰地理解各个算法原理、优缺点

针对新的数据新的问题，知道使用什么算法。

参考https://blog.csdn.net/u013369277/article/details/51645672

机器学习之邹博笔记1

猜你喜欢