cei_speaker_embedded

时间:2024-03-24 03:35:13
【文件属性】:

文件名称:cei_speaker_embedded

文件大小:42KB

文件格式:ZIP

更新时间:2024-03-24 03:35:13

Python

GE2E扬声器嵌入 该存储库是针对说话人验证的通用端到端损失的实现: 要求 Python 3.6及更高版本。 运行pip install -r requirements.txt以安装必要的软件包。 GPU是必需的,但是如果您只想使用工具箱,则不一定需要高级GPU。 数据集 理想情况下,所有数据集都保存在同一目录下,即。 默认情况下,所有预处理脚本都会将干净数据输出到在数据集根目录中创建的新目录SV2TTS。 在该目录内将创建编码器的目录。 对于编码器: LibriSpeech:Train-other-500(解压缩为LibriSpeech / train-other-500)VoxCeleb1:Dev A-D以及元数据文件(解压缩为VoxCeleb1 / wav和VoxCeleb1 / vox1_meta.csv)VoxCeleb2:Dev A-H(


【文件预览】:
cei_speaker_embedded-main
----encoder()
--------__init__.py(0B)
--------plot_umap.py(4KB)
--------inference.py(8KB)
--------config.py(1KB)
--------params_data.py(901B)
--------data_objects()
--------visualizations.py(7KB)
--------preprocess.py(9KB)
--------params_model.py(196B)
--------audio.py(4KB)
--------model.py(6KB)
--------train.py(5KB)
----.gitignore(2KB)
----requirements.txt(161B)
----utils()
--------__init__.py(0B)
--------profiler.py(1KB)
--------logmmse.py(9KB)
--------argutils.py(1KB)
----encoder_train.py(2KB)
----README.md(1KB)
----encoder_preprocess.py(3KB)
----toolbox()
--------utterance.py(222B)
--------__init__.py(10KB)
--------ui.py(20KB)
----generate_embeddings.py(3KB)
----.vscode()
--------launch.json(1KB)
----python_patch()
--------clip_grad.py(3KB)

网友评论