文件名称:wikispeech-manuscriptor:用于为TTS和ASR创建稿件的工具
文件大小:286KB
文件格式:ZIP
更新时间:2024-05-09 14:21:17
稿件2000
从较大的文本语料库中选择较小的一组句子的工具
内容
一,要求二。 设置数据库三, 脚本工具IV。 配置文件五,文件
一,要求
python3
sqlite3
达到1.16(或更高)
二。 设置数据库
1.下载Wikipedia转储文件
对于瑞典语: :
2.提取文字
python wp_dump_extract/WikiExtractor.py --no_templates -o
【文件预览】:
wikispeech-manuscriptor-master
----uml()
--------database.uml(2KB)
--------manuscriptor.svg(13KB)
--------manuscriptor.uml(770B)
--------database.svg(14KB)
----LICENSE(1KB)
----doc()
--------filter_criteria.tex(3KB)
--------manuscript_tool.tex(16KB)
--------.gitignore(21B)
--------manuscript_tool.pdf(270KB)
----.gitignore(186B)
----README.md(3KB)