文件名称:ZiToPY:基于词的bigram方法,进行字音转换
文件大小:25.01MB
文件格式:ZIP
更新时间:2024-06-01 12:50:29
ZiToPY 基于词的bigram方法,进行字音转换 步骤 1.在seg.pl中实现train语料的分词,输出分词后的文本到seg.txt中。 2.在bigram.pl中训练语料seg.txt的unigram和bigram,分别输出到uni.txt与bi.txt中。 3.在hz2py.pl中用全切分路径求优算法实现字音转换。 部分代码已注释,运行结果图在文件夹中。
【文件预览】:
ZiToPY-master
----wordlist.Dic(898KB)
----Dic.txt(289KB)
----train(13.89MB)
----seg.txt(19.01MB)
----uni.txt(937KB)
----seg.pl(1KB)
----bi.txt(36.84MB)
----hz2py.pl(4KB)
----README.md(394B)
----bigram.pl(582B)