DeepLearning | Semantic Autoencoder for Zero Shot Learning(论文、算法、数据集、代码) - 代码天地

DeepLearning | Semantic Autoencoder for Zero Shot Learning(论文、算法、数据集、代码)

其他 2020-04-20 10:45:42 阅读次数: 0

这两天事情比较少，这里再分享一个简单好用的ZSL算法
Semantic Autoencoder for Zero Shot Learning
之前也写过几篇博客简单描述了几种基本的ZSL算法
DeepLearning | Relational Knowledge Transfer for Zero Shot Learning（论文、算法、数据集、代码）
DeepLearning | Zero Shot Learning 零样本学习（扩展内容、模型、数据集）
DeepLearning | Zero Shot Learning 零样本学习
这篇博客会描述SAE方法的思想和理论解释，在文章的最后会给出算法复现的python代码

一、 Introduction

我们先明确一下符号标记 $X$ 表示数据， $S$ 表示数据的属性标签， $Y$ 表示数据的标签。

在之前的几篇博客中，我们反复提到了直接属性预测（DAP）这一经典的ZSL方法，今天我们还是用它来引出SAE。DAP先用 $X$ 训练多个学习器预测 $S$ ，在测试阶段，用训练好的学习器预测测试样本，再对着属性表进行近邻搜索确定标签 $Y$ 。

DAP存在着一些缺点，如没有办法克服域偏移的问题，训练很多学习器也是一件费时的事。
那么我们为什么不直接预测所有的属性呢？这是因为如果直接用1个网络同时预测所有的属性，会造成该网络学习得到已知类别属性的固有模式，而不具体的细分属性，这样一来，使用属性嵌入的意义就不大了，还是没有办法预测未知类别。

Semantic autoencoder（SAE）则为我们提供了另一种思路，它在普通的自编码网络上加上了一个约束，这个约束使得编码后得到的属性包含了更多数据样本本身的特点，从而使得模型可以识别未知类别

二、Approach

我们先来看一下普通的自编码器模型

$min_{W^{*},W}\left \| X- W^{*}WX\right \|^{2}$

这一模型很好理解，即 $X$ 经过两次映射 $W$ 和 $W^{*}$ 后输出 $X$ 本身，即通过一次映射 $W$ 编码，第二次映射 $W^{*}$ 解码

我们再来看一下SAE的自编码模型

$min_{W}\left \| X- W^{T}WX\right \|^{2}$
$s.t. WX=S$

相比于普通的自编码器，SAE做出了两点变化，一是要求 $W^{*}$ = $W^{T}$ ，这是为了方便后面的优化求解，二是增加了线性约束，即 $s.t. WX=S$

该模型可以图解如下：
在这里插入图片描述
仔细研究该模型，可以发现，SAE其实要求所求得的 $W$ 具有两重性质

$X$ 在经过 $W$ 映射之后可以通过 $W^{T}$ 还原，即 $WX$ 还包含 $X$ 的所有信息
$WX$ 应当尽可能的逼近 $S$

这两条性质，使得映射后得到的 $WX$ 具有较好的类别区分性质，这是普通的自编码器做不到的。
该模型的求解也十分简单，通过拉格朗日乘子法，并求导可以但模型转化为Sylvester等式的形式

$AW+WB=C$

其中 $A=SS^{T}$ , $B=\lambda XX^{T}$ , $C=(1+\lambda)SX^{T}$

该等式可以通过python 库里的Sylvester求解器直接求解, 要注意，SAE最后用于判断属性和类别远近的距离是cos距离而不是欧式距离，这会很大程度上影响模型精度

三、算法复现

AwA2的数据链接在这里：DeepLearning | AWA2 图像数据集预处理
AwA和其他数据链接在这里：https://blog.csdn.net/qq_38451119/article/details/81624468
python源代码在这里：https://github.com/LiangjunFeng/Implement-of-ZSL-algorithms

Liangjun_Feng 博客专家

发布了74 篇原创文章 · 获赞 269 · 访问量 15万+

私信关注

猜你喜欢

转载自blog.csdn.net/Liangjun_Feng/article/details/88076699

DeepLearning | Semantic Autoencoder for Zero Shot Learning(论文、算法、数据集、代码)

Semantic Autoencoder for Zero-Shot Learning

《Semantic Autoencoder for Zero-Shot learning》阅读笔记

DeepLearning | Relational Knowledge Transfer for Zero Shot Learning（论文、算法、数据集、代码）

DeepLearning | Zero Shot Learning 零样本学习

DeepLearning | Zero Shot Learning 零样本学习（扩展内容、模型、数据集）

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss代码调试过程

DeepLearning | Zero shot learning 零样本学习AWA2 图像数据集预处理

DeepLearning | Zero Shot Learning 零样本工业故障诊断

Zero-Shot learning

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss

Overview of Zero-Shot learning

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss 复现one-hot embedding版本

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss 优化调整方案

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss笔记

什么是One-shot Learning 、Zero-shot Learning？

Zero-shot learning,Few-shot learning简单理解

Zero-Shot Transfer Learning for Event Extraction

Overview of Zero-Shot Learning - 1.3

Overview of Zero-Shot learning - 1.2

Zero-shot One-shot Few-shot learning 算法

[ZSS系列]Prototypical Matching and Open Set Rejection for Zero-Shot Semantic Segmentation（ICCV 2021）

Zero-shot Learning / One-shot Learning / Few-shot Learning

zero-shot learning 论文三篇小结

Zero-Shot Learning论文阅读笔记（第二周）

One-shot Learing/Few-shot Learning、Zero Shot Learning详解

Zero-Shot, One-Shot, and Few-Shot Learning概念介绍

few-shot / one shot / zero shot object counting论文汇总

Zero Shot、Few Shot、One Shot闲聊

zero-shot 的理解

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)