文件名称:worldwindjava源码-Markov-Word-Character-Models:马尔可夫字字符模型
文件大小:1.09MB
文件格式:ZIP
更新时间:2024-06-25 16:51:05
系统开源
世界风java源码CSCI 1102 计算机科学 2 2018 年秋季 R. 穆勒老师 问题集 6:Shannon 的英语文本 n-Gram 算法 (改编自 David R. Martin 的问题集。) 10分 截止 2018 年 10 月 28 日星期日午夜 这是一对问题集。 寻找新的合作伙伴。 如果您没有考虑合作伙伴,请使用 Piazza 上的合作伙伴寻找工具,或者您可以请工作人员帮助组建您的团队。 请在您的文件顶部的评论中指出这两名团队成员。 在本作业中,您将编写一个程序,在给定示例输入文本的情况下生成新文本。 如果输入的是英文文本,那么程序将输出英文文本。 如果输入是法语,则输出将是法语。 如果输入是一个python程序,那么输出将是一个python程序。 如果输入是一个基因序列,那么输出将是一个新的基因序列。 生成的文本不会是完美的,但它会“看起来像”输入文本,因为我们将确保它具有相同的统计结构。 您将实现的算法是在一篇关于信息论的里程碑式论文中提出的。 该论文于 1948 年由 . (基本思想涉及几十年前首次探索的随机过程。)这个练习甚至可能的事实说明了语言的统计结构和信息
【文件预览】:
Markov-Word-Character-Models-master
----.gitignore(282B)
----src()
--------char_output_degree_3.txt(2KB)
--------char_output_degree_5.txt(397B)
--------char_output_degree_6.txt(708B)
--------word_output_degree_5.txt(1KB)
--------char_output_degree_1.txt(218B)
--------Model.java(324B)
--------word_input.txt(1KB)
--------char_output_degree_4.txt(754B)
--------WordModelC.java(5KB)
--------Main.java(5KB)
--------char_output_degree_2.txt(656B)
--------word_output_degree_4.txt(1KB)
--------word_output_degree_6.txt(1KB)
--------word_output_degree_3.txt(1KB)
--------char_input.txt(659B)
--------Shannon.java(778B)
--------CharModelC.java(4KB)
--------word_output_degree_1.txt(1KB)
--------word_output_degree_2.txt(2KB)
----README.md(15KB)
----img()
--------Shannon.png(1.08MB)