写在前面:学了近一年的AI基础知识 最近在整理AI学习的大框架 整理完思路清晰了很多 分享出来希望可以帮到更多人 内容还会继续继续填充
01 前言
1.1基础科普
1.1.1 人工智能应用场景
商业场景:个性化推荐 精准营销 客户细分/用户画像 预测建模
模式识别 数据挖掘 统计学习 语音识别 自然语言处理 计算机视觉
1.1.2 人工智能 机器学习 深度学习的关系
1.1.3 机器学习流程
1.2 模型评估
1.2.1 模型评估依据
1.3 数学基础
1.3.1 函数
常见函数:常函数 一次函数 二次函数 指数函数 对数函数 幂函数
导数、梯度(求导的方式、导数/二阶导数/偏导数/梯度的含义/作用)
Taylor公式
1.3.2 概率
古典概率、联合概率、条件概率、全概率公式、贝叶斯公式
期望、方差、协方差( Cov(X,Y) >=<0)
大数定理、中心极限定理
最大似然估计(MLE)
1.3.3 向量
向量、矩阵的运算
向量、矩阵的求导
SVD、QR分解
01 工具及框架
1.1 工具
1.1.1 numpy
【数据处理工具】NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生
扫描二维码关注公众号,回复: 11370507 查看本文章
1.1.2 pandas
【数据处理工具】 pandas是基于NumPy 的一种工具,用于解决数据分析任务 ,提供了高效地操作大型数据集所需的工具。提供了大量能使我们快速便捷地处理数据的函数和方法
1.2 框架
1.2.1 Scikit-Learn
【机器学习框架】Scikit-Learn库包含了常见的机器学习算法 作为python机器学习功能强大的支持包,它已经把底层的脏活、累活都默默完成了,使用者能够将宝贵的注意力和精力集中在解决问题上,极大地提高产出效率
1.2.2 Tensorflow
02 机器学习
机器学习核心思想:梯度下降
梯度下降分类:批量梯度下降(BGD) 随机梯度下降(SGD) 小批量梯度下降(MBGD)
2.1 机器学习常用算法总结
2.2 常用算法原理
2.2.1 Linear-Regression
历史数据–> 拟合平面计算式–>损失函数(误差)分析–>目标函数最小值参数seita–>回归模型–> 预测值
2.2.2 Loglstic
特征数据–>线性回归方程–>进行sigmoid激活–>输出的得分值–>比较不同预测结果的得分值
2.2.3 SVM
两类数据点–>决策方程(w /b)–>最大化点与决策边界的距离–>距离倒数的极小值(拉格朗日乘子/核函数)–>最优决策方程 (找到区分两类的hyper plane 超平面 使得边际margin 最大)
2.2.4 Decide-Tree
整个数据集(根节点)–> 通过条件(信息增益//信息增益率)–> 判断合适的前进方向–>达到不可再分的节点 --> 最终的决策结果
2.2.4.1 C4.5
2.2.4.1 CART
2.2.5 Random-Forest
训练数据集–> 随机数据采样 (第一重随机)AND 随机特征采样(第二重随机) -->训练数据集–> 建立决策树模型–>综合(平均/投票/多数结果法)–>最终结果
2.2.6 集成学习
2.2.6.1 Adboost
训练数据集–>一次划分–>更新权重–>二次划分–>更新权重–>三次划分–>更新权重–>对每次预测结果根据准确率(作为权重)乘以a–>综合相加–>最终结果
2.2.6.1 Xgboost
内部决策树用的回归树–>构造出第一棵树–>选择策略–>第二棵树–>选择策略–>第三棵树
2.2.7 K-Means
一堆数据–>初始化 k 个质心点-- >按质心算距离 聚类 --> 迭代更新质心–> 依次继续更新
2.2.8 KNN
带标签的训练数据集和待分类测试数据–>测试对象到训练集中每个对象的距离–>按距离大小排序–>选取K个与测试对象最近的标签数据–>多数表决预测
2.2.9 NaiveBayes
2.2.10 EM
03 深度学习
3.1 基础
3.1.0 Tensorflow
3.1.1 深度学习应用
· 人脸识别,手机解锁和高铁通行验证 扫脸支付
· 医疗影像诊断:放射性拍片-提升超分辨率
· 工业4.0: 预测性维护是指用连续的数据收集来预测设备故障
· 无人零售· 深度强化学习(Alpha zero等)
· AUTOML-机器学习自动化
· 自动驾驶:(百度Apollo,Google的Waymo)
· 自动辅助系统
· 跟车系统
· 高速自动巡航系统
· 自动泊车系统 自动运输卡车
· 农作物监测:管理杀虫剂、发现问题,预测天气变化如何影响农业
· 药物发现:缩短药物发现周期
3.1.2 基本概念
- 感知机模型
- 反向传播
- 正向传播
- 多层反向传播
3.2 CNN(convolutional Neural Networks)
卷积神经网络
结构
- 数据输入层:Input Layer (图片)
- 卷积计算层:CONV Layer
- ReLU激励层:ReLU Incentive Layer (激活)
- 池化层:Pooling Layer (下采样)
- 全连接层:FC Layer
3.3 RNN(Recurrent Neural Network)
循环神经网络
3.4 GANS(Generative Adversarial Networks)
生成对抗神经网络
04 计算机视觉
大规模(大数据量)图片识别(聚类/分类),如人脸识别,车牌识别,OCR
以图搜图,图像分割 目标检测,如自动驾驶的行人检测,安防系统的异常人群检测
目标检测 图像定位
- Alex Net
- SPP Net
- CNN-VGGNet
- Fast R-CNN
- Fast R-CNN RPN
- Faster RCNN
- R FCN
- YOLO
- YOLO v1
- YOLO v2
- YOLO v3
- SSD
- Cascade R-CNN
图像分类
- VGG
- GoogleNet
- RestNet
3D目标检测
- Anchor Free
- Anchor Free_UnitBox
- Anchor Free_FSAF
- Anchor Free_FCOS
- Anchor Free_CenterNet
- Anchor Free_CornerNet
- Anchor Free_CornerNet-Lite
- Anchor Free_GA RPN
05 自然语言
语音识别,语音合成自动分词,句法分析,语法纠错,关键词提取,文本分类/聚类,
文本自动摘要,信息检索(ES,Solr)知识图谱,机器翻译,人机对话,机器写作
推荐系统,高考机器人 信息抽取,网络爬虫,情感分析,问答系统
分词
词向量
常用工具
- Jieba
- HanLP
- Gensim
算法
- Seq2Seq
- 自编码神经网络
- RNN LSTM
- Attention
- Transformer
- Bert