kaldi-active-grammar:具有语法的Python Kaldi语音识别,可以在解码时动态将其设置为activeinactive

时间:2024-03-19 23:06:24
【文件属性】:

文件名称:kaldi-active-grammar:具有语法的Python Kaldi语音识别,可以在解码时动态将其设置为activeinactive

文件大小:191KB

文件格式:ZIP

更新时间:2024-03-19 23:06:24

python grammars speech-recognition speech-to-text kaldi

卡尔迪主动语法 具有语法的Python Kaldi语音识别,可以在解码时动态设置有效/无效 开发了Python软件包,以便使用自动语音识别引擎在语音识别框架中实现对计算机应用程序的基于上下文的命令和控制。 [ GitHub与(仅)我的GitHub赞助者捐款相匹配。] 通常,Kaldi解码图是整体的,需要昂贵的前期离线编译,并且在解码期间是静态的。 卡尔迪(Kaldi)的新语法框架允许将多个具有非终结符的独立语法分别编译并在解码时动态地拼接在一起,但是所有语法始终处于活动状态并且能够被识别。 该项目扩展了该功能,以允许将每个语法/规则在每个发音基础上(分别在每个发音的开头设置)独立地动态地标记为有效/无效。 然后,蜻蜓能够仅针对当前环境激活适当的语法,由于可能的识别较少,因此提高了准确性。 此外,听写语法可以在所有命令语法之间共享,可以快速编译而无需直接包含大词汇听写。 特征 二进制文


【文件预览】:
kaldi-active-grammar-master
----setup.py(12KB)
----.gitignore(313B)
----pyproject.toml(84B)
----requirements-build.txt(50B)
----CHANGELOG.md(3KB)
----building()
--------build-wheel-dockcross.sh(1KB)
--------dockcross-manylinux2010-x64(6KB)
--------kaldi-configure-wrapper.sh(281B)
--------build-wheel-manylinux.sh(742B)
--------Dockerfile.manylinux(2KB)
----setup.cfg(666B)
----LICENSE.txt(34KB)
----.github()
--------FUNDING.yml(66B)
--------workflows()
--------release_notes.md(19KB)
----examples()
--------requirements_audio.txt(43B)
--------plain_dictation.py(481B)
--------mix_dictation.py(2KB)
--------util.py(2KB)
--------full_example.py(3KB)
--------audio.py(13KB)
--------test.wav(61KB)
----README.md(13KB)
----Justfile(3KB)
----kaldi_active_grammar()
--------wrapper.py(35KB)
--------kaldi()
--------__init__.py(676B)
--------ffi.py(1KB)
--------compiler.py(39KB)
--------plain_dictation.py(3KB)
--------wfst.py(16KB)
--------LICENSE.txt(34KB)
--------utils.py(14KB)
--------__main__.py(3KB)
--------defaults.py(357B)
--------model.py(23KB)
----docs()
--------models.md(6KB)
--------demo_video.png(21KB)
----CMakeLists.txt(7KB)

网友评论