文件名称:TTS_TFLite:该存储库是TFLite中的TTS模型的集合
文件大小:61.4MB
文件格式:ZIP
更新时间:2024-06-11 01:33:50
JupyterNotebook
该存储库提供了TensorFlow Lite(TFLite)中广泛流行的文本语音转换(TTS)模型的集合。 这些模型主要来自两个存储库和 。 我们提供了端到端的Colab笔记本,这些笔记本展示了使用TFLite进行模型转换和推理的过程。 这还包括将PyTorch模型转换为TFLite。 TTS分为两个步骤-首先使用TTS模型生成MEL频谱图,然后将其传递给VOCODER以生成音频波形。 我们将这两个模型都包含在此存储库中。 请注意,这些模型是在上训练的。 文本“比尔养成自问的习惯”(使用Fastspeech2和MelGAN)。 随附型号 TTS: * 声码器: (MB MelGAN) 将来,我们可能会添加更多模型。 *当前,无法进行Glow TTS模型的转换(请参阅的问题)。 当前, Forward Tacotron仅支持ONNX转换。 转换为TensorFlo
【文件预览】:
TTS_TFLite-main
----audio_samples()
--------hifigan.wav(114KB)
--------tacotron2+mb-melgan.wav(119KB)
--------fastspeech2+mb-melgan.wav(114KB)
--------tacotron2+pwgan.wav(119KB)
--------tacotron2+melgan.wav(119KB)
--------fastspeech2+pwgan.wav(114KB)
--------fastspeech2+melgan.wav(114KB)
----Wav2Vec2_0_HuggingFace.ipynb(6KB)
----Forward_Tacotron_PyTorch_TFLite.ipynb(21KB)
----models()
--------hifigan_dr.tflite(3.45MB)
--------melgan_float16.tflite(8.3MB)
--------parallel_wavegan_float16.tflite(3.1MB)
--------melgan_dr.tflite(16.41MB)
--------parallel_wavegan_dr.tflite(5.61MB)
--------hifigan_float16.tflite(2.89MB)
--------fastspeech_quant.tflite(29.58MB)
----LICENSE(11KB)
----Parallel_WaveGAN_TFLite.ipynb(89KB)
----MelGAN_TFLite.ipynb(6KB)
----README.md(6KB)
----End_to_End_TTS.ipynb(174KB)
----HiFi-GAN.ipynb(475KB)