Deep Learning学习笔记（三）：图像分类基础

文章目录

1.监督学习、无监督学习
2.构建深度学习模型的四个步骤（以监督学习为例）
3.基于特征的学习和基于深度学习的图像分类

1.监督学习、无监督学习

监督学习：给定一个数据集并提供标签和属性，最终针对新的问题给出答案，常用于解决回归问题和分类问题，在图像分类中，图像数据集由图像及相应的标签组成，使用这些标签来教机器学习分类器每个类别“看起来像什么”。如果分类器做出了错误的预测，我们可以来纠正它的错误。
无监督学习：只有数据集没有提供标签和属性，找出一批数据的类型结构，比如聚类算法
常用的监督学习算法包括逻辑回归、支持向量机(SVMs)，随机森林，人工神经网络。无监督学习的经典机器学习算法包括主成分分析(PCA)和k-均值聚类。具体到神经网络，我们看到自动编码器，自组织映射(SOMs)，和自适应共振理论应用于无监督学习。

2.构建深度学习模型的四个步骤（以监督学习为例）

（1）收集数据集
每个类别的图像数量应该近似一致，否则我们的分类器就会变成很自然地倾向于这些有大量代表性的类别。
（2）分割数据集
现在我们有了我们的初始数据集，我们需要把它分为两部分:训练集和测试集
我们的分类器使用训练集“学习”，对输入数据进行预测，然后在预测错误时进行自我更正。在分类器经过训练后，我们可以在测试集上评估性能。
训练集和测试集相互独立是非常重要的！！!如果使用测试集作为训练数据的一部分，那么分类器会拥有不公平的优势，因为它已经看到了以前的测试例子。
用于培训和测试的数据集常用分割尺寸包括66.6%33.3%、75%/25%和90%/10%，这些数据分割是有意义的。
神经网络有许多参数(例如，学习率，衰减，正则化等)需要调整，需要创建第三个数据集称为验证集，来自训练数据，并被称作“假测试数据”，用于调整我们的参数，我们通常分配大约10-20%的培训数据用于验证。
（3）训练网络
实际的“学习”是如何实现？一般采用梯度下降法，之后会详细介绍。
（4）评估
对于测试集中的每个图像让它预测图像的标签是什么。
然后汇总模型对测试集中图像的预测结果。
最后将这些模型预测与我们的测试集中的基本真值标签进行比较，计算分类器得到正确预测的次数，并计算诸如精度等指标量化网络的性能。

3.基于特征的学习和基于深度学习的图像分类

在传统的基于特征的图像分类方法中，实际上需要在步骤（2）和步骤（3）之间插入一个步骤：特征提取。在这个步骤中，我们使用了诸如HOG、LBPs等人工工程算法来量化图像的内容。鉴于这些特征训练分类器和评估它。
在构建卷积神经网络时，我们实际上可以跳过特征提取的一步。这是因为CNN是端到端的模型。我们提供原始的输入数据(像素)到网络，然后，网络学习其隐藏层中的过滤器，可以用来区分对象类。网络的输出是一个标签的概率分布。使用CNNs不再需要对手工设计的功能大惊小怪——我们可以让我们的网络学习这些功能。

Gentle Jade

发布了23 篇原创文章 · 获赞 25 · 访问量 872

私信关注