CNN-第四周

1. 人脸识别

Face recognition可分为:Verification, Recognition。
这里写图片描述

1.1 One Shot Learning

One shot learning所针对的情况是,在训练集只有一张目标对象的图片时,正确识别目标对象。
这里写图片描述
显然基于我们之前的知识,在只有目标对象的一个训练样本时,无法构建出一个有效的深度学习模型。因此我们相信构建一个能够学习分辨两个样本相似度的模型。
Learning a “similarity” function
这里写图片描述

那么如何去比较两种图片的相似度呢?Siamese Network将告诉我们

1.2 Siamese Network

这里写图片描述
过程:将图片输入CNN模型,利用最后某一层作为该图片的编码代表,然后比较任意两张图片在该层的差异。
这里写图片描述
下一步我们将告诉模型怎样判断两张图片的差异大小。

1.3 Triplet Loss

在模型训练时,每次我们都喂给模型三张图片,一张目标图片,一张阳性图片(同一个人),一张阴性图片(非同一个人)。然后让调整参数,使得模型判别目标图片与阳性图片的相似高高于目标图片与阴性图片的相似度。
这里写图片描述
Loss function
在训练集里我们还是需要同一个人的多张照片。
这里写图片描述

Choosing the triplets A, P, N

然而如果是完全随机选择的一张图片作为阴性样本,则很容易达到A与P的相似度远高于A与N,这样模型的学习过程就会变得非常低效。因此我们需要在初始时,选择那些很相近的三联体(triplets)。
这里写图片描述

Training set using triplet loss
这里写图片描述

1.4 Face Verification and Binary Classification

Learning the similarity function
这里写图片描述

2. 风格迁移

Neural style transfer
这里写图片描述

2.1 What are deep ConvNets learning?

利用可视化图像去观察深度神经网络模型所学到的特征。
从下图可以发现,第一层的神经元大多在学习识别简单的直线线条:
这里写图片描述

随后的深层神经元会逐渐学习更复杂的特征:
这里写图片描述

2.2 Cost Function

为了实现风格迁移,我们也要选择一个损失函数。
这里写图片描述

Find the generated image G
首先随机初始化一张图像G(像素随机分布),然后利用梯度下降算法降低损失函数
这里写图片描述

2.3 Content Cost Function

这里写图片描述

2.4 Style Cost Function

什么是Style?
我们用卷积网络的第L层神经元去度量“style”;style 被定义为不同channels的激活值的相关性(correlation)
这里写图片描述
Intuition about style of an image
correlation 指示两组特征同时出现的几率。
这里写图片描述
Style matrix
这里写图片描述
这里写图片描述
(风格迁移的损失函数这块确实有点跟不上了)

2.5 1D and 3D Generalizations

Convolutions in 2D and 1D
这里写图片描述

这里写图片描述

注:如无特殊说明,以上所有图片均截选自吴恩达在Coursera开设的神经网络系列课程的讲义。

猜你喜欢

转载自blog.csdn.net/maryyu8873/article/details/79605262