transcribed-corpus-tools:转录词语料库的语料库工具

时间:2024-05-12 18:46:50
【文件属性】:

文件名称:transcribed-corpus-tools:转录词语料库的语料库工具

文件大小:7.69MB

文件格式:ZIP

更新时间:2024-05-12 18:46:50

Python

转录语料库工具 用于从语音词语料库中转录和提取定量信息的Python工具 代码 脚本位于Scripts/文件夹中,而Aymara/ , Spanish/ , English/和NkoreKiga/文件夹包含这些语言的输入和输出文件。 在Scripts/ ,以tct开头的文件名包含整个工具包的实用程序函数和类,并且以ay和nk开头的脚本分别直接与Aymara和Nkore-Kiga语料库一起运行。 tct_languages.py定义了Language类别以及该项目中使用的语言变量。 Language对象允许在其他脚本中轻松引用给定语言中的自然类(例如,高元音,中止和助词)。 tct_utility_py定义了一组实用程序函数,用于打开文件并将它们的内容读入集合,将可迭代项写入文件,将字典写入制表符分隔的文件以及使转录的单词集与UCLA的空格分隔兼容语音学习者(Hayes和Wilson,2


网友评论