文件名称:langdetect:口语检测(斯坦福CS 229班项目)
文件大小:21KB
文件格式:ZIP
更新时间:2024-07-27 06:28:59
Python
安装
克隆这个 repo,然后运行:
# Set up virtualenv
virtualenv . && source bin/activate
# Install package requirements
pip install -r requirements.txt
要构建训练数据(使用prepare.py ),您需要以下包:
,用于从 OGI 声音格式解码
,用于声音预处理
,用于音频特征提取
这些包中的二进制文件需要在您的PATH中,语料库处理脚本才能正常工作。
数据
我们使用进行训练和评估。 您可以通过 LDC 获取该语料库的副本。
重新下载 OGI 语料库,运行prepare.py将语料库转换为可用于此软件的格式:
python prepare.py
【文件预览】:
langdetect-master
----.gitignore(41B)
----README.md(2KB)
----prepare.py(11KB)
----nodules.py(18KB)
----make_dummy_data.py(842B)
----print_weights.py(1KB)
----nodule_features.py(2KB)
----__init__.py(0B)
----config()
--------nodules.baseline.cfg(107B)
--------opensmile.001.conf(13KB)
----requirements.txt(48B)
----recording.py(504B)
----prepare_accents.py(11KB)
----data()
--------.gitkeep(0B)