文件名称:Autocomplete:基于N-gram语言模型的下一个词预测
文件大小:4.7MB
文件格式:ZIP
更新时间:2024-07-21 16:14:15
R
自动完成 概括 这个代表包含一个 n-gram 语言模型,它预测下一个单词,给定一个文本短语作为输入。 预测模型是作为一个闪亮的 Web 应用程序实现的,其中输入文本框启用了 jQuery-ui 自动完成小部件的功能。 最终结果是显示在输入文本框下方的建议词列表,并随着用户键入而不断更新。 文件说明 nGramsLite.RData :包含四个数据帧(ngram1、ngram2、ngram3 和 ngram4)的 R 数据文件。 每个数据帧对应一个特定长度的 n-gram,包含三列(n-1 个短语、第 n 个单词和相应的出现频率)。 例如,ngram4 数据框中的前 3 个条目是: n-1 短语 第n个字 数数 1 结尾 这 7676 2 其余的 这 6698 3 在最后 的 6651 ngramPredictionFunction.R :一个 R 函数,它根据给定的短语和一