文件名称:普通话:机器学习的音频分类
文件大小:1.06MB
文件格式:ZIP
更新时间:2024-03-02 02:35:13
machine-learning voice audio-processing streaming-audio Python
共同的声音 实时部署: 数据 该项目的数据来自 ,这是Mozilla发起的一项众包项目,旨在为语音识别软件创建免费的数据库。 该项目得到了志愿者的支持,他们用麦克风录制了例句,并查看了其他用户的录音。 转录的句子将被收集到语音数据库中,该数据库可在公共领域许可CC0下获得。 该许可证确保开发人员可以将数据库用于语音到文本应用程序而不受限制或花费。 Common Voice的出现是对诸如Amazon Echo,Siri或Google Assistant等大公司的语言助手的回应 总览 该项目的目标是创建一个端到端的机器学习应用程序,该应用程序可以实时记录和处理音频并通过套接字API进行流预测。 录音和输出预测之间有1秒的延迟延迟。 该应用程序生成3类预测:性别,年龄和原籍国。 去做: 追踪和实施国家和年龄模型 入门: 火车模型 将数据目录修改为您自己的目录 class DataDire
【文件预览】:
Common-Voice-master
----.gitignore(55B)
----Dockerfile(1KB)
----requirements.txt(347B)
----.dockerignore(143B)
----commonvoice()
--------api()
--------Dockerfile(177B)
--------server()
--------__init__.py(0B)
--------default.conf(1KB)
--------VERSION(5B)
----LICENSE(1KB)
----run_pipeline.py(379B)
----run_app.py(96B)
----docker-compose.yml(955B)
----.github()
--------workflows()
--------dependabot.yml(144B)
----README.md(4KB)
----run.sh(154B)
----.circleci()
--------config.yml(1KB)
----deploy.sh(78B)
----sweep-grid-hyperband.yaml(630B)
----audio_model()
--------setup.py(2KB)
--------pipeline.py(5KB)
--------__init__.py(495B)
--------MANIFEST.in(249B)
--------VERSION.txt(5B)
--------audio_model()
--------test()