AutomaticSpeechChunker:从大型语音音频文件及其相应的文本正文中,自动将音频和文本分成 (phrase, audio_snippet) 对。 与连接主义时间分类 (CTC) 成本算法一起使用

时间:2024-06-25 20:32:22
【文件属性】:

文件名称:AutomaticSpeechChunker:从大型语音音频文件及其相应的文本正文中,自动将音频和文本分成 (phrase, audio_snippet) 对。 与连接主义时间分类 (CTC) 成本算法一起使用

文件大小:38.95MB

文件格式:ZIP

更新时间:2024-06-25 20:32:22

Python

自动SpeechChunker 从大型语音音频文件及其相应的文本正文中,自动将音频和文本分成 (phrase, audio_snippet) 对。 用于连接主义时间分类 (CTC) 成本算法。


【文件预览】:
AutomaticSpeechChunker-master
----1.5 Stats.ipynb(4KB)
----Training_Meta.pkl(2KB)
----chunk_directories_from_file.py(41B)
----chunker.py(2KB)
----1. Preprocessing Utilities.ipynb(46.9MB)
----Automatic Chunking.ipynb(84KB)
----0. Acquiring Speech and Transriptions.ipynb(24KB)
----README.md(244B)
----2. Automatic Chunking.ipynb(18.69MB)
----preprocessing_utilities.py(10KB)
----speech_model_trained.py(8KB)

网友评论