paper-reading

时间:2024-04-19 03:33:03
【文件属性】:

文件名称:paper-reading

文件大小:5KB

文件格式:ZIP

更新时间:2024-04-19 03:33:03

演讲 文字转语音 不。 标题 思维 1。 长格式相关 2。 这个不大认同,不知是其中一部分工作,1)基线的设置不公平,2)振动问题,作者使用了freq-D,但除了mos微小的提升外,没有其他说明振动是freq-D解决的3)根据以前的经验,直接在vocoder的频谱做判别,并不会带来惊艳的效果,不直接 3。 对pwg D的改进,1)大感受野,发现谐波分量的长期变化并惩罚任何有害的非周期性噪声分量; 2)小卷积核,专注于详细的高频,因为其特性噪声成分变化很快。 3)在我看来真正的工作的状况和大的卷积核 4, 1)DTW,2)GAN-TTS,3)投影嵌入D, 5, 甘肃省 6, 他加不同noise,我们可不可以加不同phase 7 STFT损失另外加了一个排斥项 8。 新的生成模型 9。 这个纸也挺有意思做alignment的,可能可以丰富EATS上次那个DTW的做法 伺服合成系统 不。


【文件预览】:
paper-reading-main
----README.md(11KB)

网友评论