PPG-TTS-Tacotron-Rayhane-ALi: 用Tacotron跑降采样PPG到MEL

其他 2021-01-23 03:26:04 阅读次数: 0

0. 说明

项目对应文件夹在: C:\Users\rucli\Desktop\2021-1-22-阿里PPG-TTS-Tacotron-跨语言

之前就跑过不降采样的, 已经能够出效果了:

我的代码: https://github.com/ruclion/linears_decoder_tacotron-2-joee
欣陶的代码: https://github.com/ruclion/linears_decoder_tacotron-2-zhaoxt-tacoLinear

现在严格按照阿里论文复现

其中PPG的准备, 用之前版本的, 参考: https://blog.csdn.net/u013625492/article/details/109670529

1. 模型结构

1.1. Paper结构

具体的超参数参看1.2

本地化和Paper的区别在于:

PPG的维度, 中英文类别, ASR模型, 训练语料
本地化LSTM中有0.1的Zone Out. 论文没有
本地化声学参数使用mel-Rayhane标准, mel-PPG 标准. 论文lpc feature
TeacherForcing的比例. 论文没说
Encoder中CNN的dropout, Post-Net中dropout. 论文没说
Attention部分
Decoder中LSTM的输入拼接为[pre_out, last_context vector]. 论文图中是[pre_out, [last_context vector, last_LSTM_out]]

1.2. 本地化结构

(其实基本上就是Rayhane版本)

2. 训练算法

2.3. Fine-Tune 训练 + Frozen 控制

Attention + Decoder 重训练, Encoder Frozen
Decoder 重训练, Encoder + Attention Frozen
Conv Layer Post-Net 重训练, Encoder + Attention + Decoder Frozen

3. PPG序列降采样算法

以下三种bottleneck方案对比

zone out结构
input sample
rnn后每32采最后一帧

猜你喜欢

转载自blog.csdn.net/u013625492/article/details/112481217

PPG-TTS-Tacotron-Rayhane-ALi: 用Tacotron跑降采样PPG到MEL

PPG-TTS-Tacotron-ALi: 基于阿里改进Tacotron PPG-TTS的Pytorch代码实现

声学参数-MEL&MFCC-Rayhane&PPG_hjk2标准: PPG项目audio_hjk2处理wav文件对比Tacotron-Rayhane的audio处理

Tacotron

tacotron2: Natural TTS Synthesis by Conditioning Wavenet on mel spectrogram predictions

声学参数-MEL-AutoVC&PPG_hjk2标准: AutoVC超参数用WaveNet + GL恢复

端到端的TTS深度学习模型tacotron(中文语音合成)

PPG原理

Maybe-TTS: 自准备数据集训练Tacotron+Vocoder

TACOTRON:端到端的语音合成

【阅读论文】Tacotron2，结合wavenet通过mel频谱实现自然语音合成

Wrist PPG数据集

Tacotron2

tacotron2 介绍

【论文翻译】Tacotron：端到端语音合成

语音识别：从 WaveNet 到 Tacotron，再到 RNN-T

论文翻译-语音合成：Tacotron

论文阅读 Tacotron2

Tacotron 的基于 Guided Attention 的实现

Tacotron 的基于 Forward Attention 的实现

Tacotron 的基于 GMM Attention 的实现

【AM】Non-Attentive Tacotron

谷歌tacotron端到端的文本转语音合成模型实践

PPG血氧饱和度计算

从PPG重建ECG心电图的初步研究

论文翻译-语音合成：Tacotron 2

Tacotron: Towards End-to-End Speech Synthesis

基于Tacotron模型的语音合成实践

谷歌Tacotron-2运行笔记

基于Tacotron汉语语音合成的开源实践

今日推荐

周排行

(BIND最佳实践)Linux运维最佳实践

makefile ifeq之坑: 1. syntax error near unexpected token 2. *** missing separator. Stop.

easyui datagrid操作栏内置图片按钮

SQLyog连接MySQL时出现的2058错误解决方法

linux音频开发

hashcode方法简析

SpringBoot中使用Transaction注解遇到的坑

逆战-CSS中子元素在父元素中的4种水平垂直居中方法

Expression.Blend.4 Chapter 图片和视频的使用

springMVC返回void值

每日归档

更多

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)