文件名称:speech-to-text:使用keras的语音识别框架
文件大小:33KB
文件格式:ZIP
更新时间:2024-06-07 08:36:24
keras speech-recognition speech-to-text Python
语音转文字 该框架提供了python脚本来训练用于语音识别的神经网络。 要求 Python 3.6+ 先决条件 安装依赖项 安装requirements.txt列出的必需python依赖项: pip install -r requirements.txt 提供培训数据 要进行培训,需要培训数据。 培训接受一个文件,该文件包含有关培训数据的元数据。 该文件本身是一个由数组组成的JSON文件。 每个元素具有以下属性: path :音频文件的绝对路径 text :音频文件的转录 训练数据文件可能如下所示: [ { " path " : " path/to/audio/file1.wav " , " text " : " hello world " }, { " path " : " path/to/audio/file2.wav " , " te
【文件预览】:
speech-to-text-master
----train.py(1KB)
----utils()
--------fs.py(354B)
--------__init__.py(0B)
--------list.py(517B)
----statistics.py(828B)
----prediction()
--------__init__.py(0B)
--------prediction.py(2KB)
----requirements.txt(94B)
----__init__.py(0B)
----predict.py(1KB)
----examples()
--------training.config.json(212B)
--------english.json(184B)
----models.py(5KB)
----LICENSE(34KB)
----speech()
--------processing.py(932B)
--------__init__.py(0B)
--------alphabet.py(1KB)
----README.md(4KB)
----training()
--------datagenerator.py(4KB)
--------trainingdata.py(2KB)
--------__init__.py(0B)
--------training.py(4KB)
--------trainingplan.py(1KB)
--------trainingconfig.py(2KB)
--------callbacks()
--------errors()
--------trainingstatistics.py(1KB)
--------trainer.py(2KB)
----logger.py(512B)
----logging.json(1KB)
----continuetraining.py(1KB)