deepvoice3-tensorflow:基于Tensorflow的DeepVoice3 https实现

时间:2021-05-15 07:38:14
【文件属性】:
文件名称:deepvoice3-tensorflow:基于Tensorflow的DeepVoice3 https实现
文件大小:5.76MB
文件格式:ZIP
更新时间:2021-05-15 07:38:14
Python deepvoice3-tensorflow 基于tensorflow实施 。 该项目从@ r9r9创建的移植。 地位 该项目目前正在进行中。 我的目标是通过使用DeepVoice3构建日语的端到端TTS模型。 如果您对具有各种数据集支持和预训练模型的多扬声器实现感兴趣,请参考原始实现: : 。 该项目的当前局限性如下: 仅支持数据集 没有多扬声器实施 评估和推断脚本尚未准备好 未实现梅尔-线性频谱图转换器 正在进行培训和超参数调整 我仍然没有获得清晰和单调的对齐方式。 我将在获得良好结果后报告。 要求 python> = 3.6 张量流> = 1.7 安装 pip install -e ".[train]" pip install -e ".[test]" pip install -e ".[jp]" 前处理 以下命令预处理文本和音频数据。 名称参数必须为jsut,因为J
【文件预览】:
deepvoice3-tensorflow-master
----deepvoice3_tensorflow()
--------models.py(7KB)
--------frontend()
--------positional_concoding.py(4KB)
--------cnn_cell.py(2KB)
--------weight_normalization.py(2KB)
--------ops.py(4KB)
--------modules.py(19KB)
--------hooks.py(4KB)
--------deepvoice3.py(37KB)
----eval.py(2KB)
----visualize_alignment.py(4KB)
----BUILD(0B)
----data()
--------audio.py(1KB)
--------tfrecord_utils.py(5KB)
--------__init__.py(2KB)
--------jsut.py(9KB)
----train.py(3KB)
----tests()
--------conv1d_graph_test.py(3KB)
--------positional_encoding_graph_test.py(2KB)
--------model_graph_test.py(2KB)
--------conv1d_glu_graph_test.py(3KB)
--------BUILD(1KB)
--------cnn_cell_eager_test.py(4KB)
--------conv1d_incremental_graph_test.py(3KB)
--------weight_normalization_graph_test.py(4KB)
--------decoder_eager_test.py(9KB)
--------linear_graph_test.py(1KB)
--------__init__.py(0B)
--------frontend_graph_test.py(11KB)
--------converter_graph_test.py(1KB)
--------attention_layer_eager_test.py(11KB)
--------sinusoidal_encoding_embedding_graph_test.py(2KB)
--------test_data()
----preprocess.py(1KB)
----hparams.py(2KB)
----setup.py(631B)
----.gitignore(1KB)
----.circleci()
--------config.yml(1KB)
----visualize_mel.py(4KB)
----README.md(3KB)
----WORKSPACE(0B)
----pylintrc(11KB)

网友评论