最近看了几篇one-shot系列的论文,对于我来说真的是头大啊,耐着性子用着翻译软件每篇论文读了五六遍之后,也算是懂了吧
这一篇先来写一下:Matching Networks for One Shot Learning
这篇文章主要讲的就是匹配问题,对于surport set(待匹配集合)可以出现训练集中从未出现的类别
首先网络结构图
如上图左侧四只是一个surport set也就是训练集,右下那只test sample,五只一起组成一个task
主要任务就是匹配test sample具体是属于surport set中的哪一类S → cS(ˆx) 用概率的公式可表示为P(ˆy|x, S ˆ ) 其中的S就是surport set
首先经过g f 文中用的四层卷积网络得到图片的特征然后通过LSTM增强个体与全局的联系
然后做cos距离上的softmax 最后匹配test sample的类别
模型结构:
其中
c就是计算余弦距离
对于LSTM其实是一种特殊的RNNs网络,RNNs通过不停的将信息循环操作,保证信息的持续存在,但同时带来了长依赖的问题
LSTM通过门结构(遗忘门、输入门、输出门)来对信息进行增删,从而解决长依赖的问题。
rnns和lstm结构图如下:
rnns:
lstm:
整体网络结构代码如下:
最后实验:1,首先是在omniglot数据集上,此数据集与mnist手写体数据集类似
2.在作者从imgnet数据集随机选取了100类数据做成一个minimgenet数据集
3。同样在imagenet数据集上作调整: