MelGAN-VC: Voice Conversion and Audio Style Transfer on arbitrarily long samples using Spectrograms

其他 2021-12-14 18:16:31 阅读次数: 0

时间：2019
作者：Marco Pasini

文章目录

abstract

使用GAN网络进行非平行数据的VC变换，而且可以用于音乐上的风格迁移。

3. Model

在这里插入图片描述
对于 $M\times t$ 的语音，固定为 $M\times L$ 的片段（L<t）,然后每次送入 $M\times L/2$ 的片段给生成器，生成等长的片段，再给判别器。最后把生成的进行拼接。

3.2 Adversarial Loss

hinge loss：生成器生成，判别器区分生成的还是真实的

3.3 TraVeL Loss

保证转换前后内容一致：通过cosine similarity and euclidean distance保证转换vector的角度和幅度和source一致；
cosine_similarity
siamese margin-based contrastive loss

3.4 Identity Mapping

尽管有3.3的限制，但是还是有一些文本信息没有保留下来，
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_40168949/article/details/114262138

MelGAN-VC: Voice Conversion and Audio Style Transfer on arbitrarily long samples using Spectrograms

Seen and Unseen emotional style transfer for voice conversion with a new emotional speech dataset

Transferring Source Style in Non-Parallel Voice Conversion

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss

Non-parallel Voice Conversion using Weighted Generative Adversarial Networks

The Voice Conversion Challenge 2018

[Style Transfer]——MedGAN: Medical Image Translation using GANs

[Style Transfer]——Blood Vessel Geometry Synthesis using Generative Adversarial Networks

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss 复现one-hot embedding版本

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss 优化调整方案

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss代码调试过程

AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss笔记

2018icassp-Non-parallel voice conversion using variational autoencoders conditioned by phonetic PPGs

Parallel-data-free voice conversion using cycle-consistent adversarial networks

Many-to-Many Voice Conversion based Feature Disentanglement using Variational Autoencoder

StarGAN-VC： non-parallel many-to-many voice conversion with StaGAN

【VC】VQVC+: One-Shot Voice Conversion by Vector Quantization and U-Net architecture

[Style Transfer]——Deep Photo Style Transfer

[Style Transfer]——Neural Style Transfer: A Review

【VC】END-TO-END ACCENT CONVERSION WITHOUT USING NATIVE UTTERANCES

经典论文重读---风格迁移篇(一)：Image Style Transfer Using Convolutional Neural Networks

CNN实现图像风格迁移 ---Image Style Transfer Using Convolutional Neural Networks

Style Transfer 合集

Neural style transfer

Neural Style Transfer: A Review

Deep Photo Style Transfer

Whether To Pretrain DNN or Not?: An Empirical Analysis for Voice Conversion

Unsupervised Cross-Domain Singing Voice Conversion

李宏毅，语音转换，voice conversion

Self-Supervised Representations for Singing Voice Conversion

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)