open_stt:打开STT

时间:2024-06-11 16:10:56
【文件属性】:

文件名称:open_stt:打开STT

文件大小:14KB

文件格式:ZIP

更新时间:2024-06-11 16:10:56

dataset russian automatic-speech-recognition speech-to-text stt

俄语开放语音转文本(STT / ASR)数据集 可以说是迄今为止最大的俄罗斯公共STT数据集: 约16m的发音(1-2m的注释不够完美,请参见 ); 约20000小时; 2,3 TB( int16中为.wav格式),. opus中为.opus ; 新领域-公开演讲; 庞大的Radio数据集可更新10 000多个小时; (新! )与OPUS合作的实用程序; (新! )新的OPUS洪流; (新! )新的OPUS直接链接; 证明错了! 公开问题,合作,提交公关,贡献,共享您的数据集! 让我们以俄语(及更多)使STT开放并作为CV模型提供。 重要的-假设ё到处被替换е 。 计划发布: 正在使用其他3种语言进行新项目,敬请期待! 目录 下载说明 端到端下载脚本 注释方法 音频标准化 磁盘数据库方法 辅助功能 如何打开作品 联络人 致谢 常问问题 执照 捐献 商业查询 进一步阅


【文件预览】:
open_stt-master
----md5sum.lst(3KB)
----LICENSE(73B)
----download.py(724B)
----.github()
--------FUNDING.yml(671B)
----utils()
--------soundfile_opus.py(1KB)
--------open_stt_utils.py(6KB)
----README.md(29KB)
----download.sh(639B)

网友评论