sagemaker_spoken_language_identification下载

【文件属性】：

文件名称：sagemaker_spoken_language_identification

文件大小：66KB

文件格式：ZIP

更新时间：2024-05-03 12:11:14

Python

Sagemaker_spoken_language_identification 本项目基于 Amazon Sagemaker 实现语音语言种类识别。准备数据按照以下的格式准备数据：每个语言音频约10个小时： 1、音频不含噪音，背景音； 2、不同的发音者，男女比例相当，越多样性越好； 3、每个音频文件时长10~20分钟； 4、mp3格式，单声道，采样率22050； 5、语言命名规范为: '语言代码_性别_音频名称'，比如 de_f_1233444422.mp3, de 为语言代码，f表示女声，m表示男声，123344422为音频名称；前缀'de' 'cn'等代表不同的语种数据分训练数据和测试数据，并且可以准备一定的噪音数据（噪音数据参考）。第一步：数据预处理执行 1-processing 下的 processing.ipynb 第二步：模型训练执行 2-training

立即下载

【文件预览】：
sagemaker_spoken_language_identification-master
----3-inference()
--------slr()
--------Dockerfile(3KB)
--------inference.ipynb(16KB)
----README.md(1KB)
----2-training()
--------source()
--------sagemaker-train.ipynb(4KB)
----1-processing()
--------docker()
--------processing.ipynb(12KB)
--------preprocess.py(386B)

秒客网

sagemaker_spoken_language_identification

网友评论