文件名称:Python构建二元语法模型.zip
文件大小:1.53MB
文件格式:ZIP
更新时间:2023-12-29 05:25:07
Python 二元语法模型
问题:写一个Python程序,使用给定的语料库(metadata.txt的第三列文本),构建二元语法模型,用MLE(最大似然估计)去估计bigram的概率,可以不使用数据平滑技术。需要使用控制台输入法演示该语言模型:当输入一个单词后,程序自动推荐接下来最可能输入的5个单词,如果用户根据推荐或自主输入下一个单词,程序以同样的方式推荐接下来最可能输入的5个单词,以此使用户循环输入。
【文件预览】:
Python构建二元语法模型
----newdata.txt(1.26MB)
----generate_base.py(3KB)
----test.py(1KB)
----words_base.json(4.08MB)
----extract_data.py(691B)
----README说明.txt(2KB)
----metadata.txt(2.64MB)