拼音输入法自然语言处理

时间:2022-12-26 12:18:01
【文件属性】:

文件名称:拼音输入法自然语言处理

文件大小:16.31MB

文件格式:ZIP

更新时间:2022-12-26 12:18:01

python 人工智能 自然语言处理 HMM

两个py文件,一个是利用文本训练并保存,另外一个是拼音转汉字,基于隐马尔可夫模型HMM,拼音输入法可以按注音符号与汉语拼音两种汉字拼音方案分成两大类。汉语拼音输入法的编码是依据汉语拼音方案(汉字的读音)进行输入的一类中文输入法。早期只有全拼这种方式,即完全依照汉字的整个音节来输入。随着技术的发展,拼音输入法不仅可以简拼还出现了一种只需两键就能输入整个音节的双拼方案。


【文件预览】:
data
----sina_news_gbk()
--------README.txt(145B)
----input.txt(2KB)
----output.txt(1KB)
----trained()
--------table.txt(24KB)
--------num.npy(53KB)
--------simple_matrix.txt(22.65MB)
--------matrix.npy(348.95MB)
--------table.npy(31KB)
--------mapping.npy(105KB)
src
----ime.py(4KB)
----train.py(3KB)

网友评论