文件名称:SentenceParseNew : Parts Of Speech tagger:将一个句子作为输入并返回每个单词的词性标签-matlab开发
文件大小:5KB
文件格式:ZIP
更新时间:2024-06-19 07:27:43
matlab
要求 : 1) 函数 checker_first :用户编写2) 函数 checker_rest : 用户编写3) 函数 most_prob : 用户编写4) TrainingDataSPNew 所有这些文件也都可用。 该程序将一个字符串作为用户的输入,并为句子中的每个单词返回词性标记。 它依赖于 TrainingDataSPNew 中的训练数据,每次对句子进行标记时都会更新该数据(在用户确认标记后,以防止错误标记)。 它使用 Bigram 模型,其中根据该单词的训练数据中存在的标签以及输入句子中相关单词之前的单词的标签计算单词最可能的标签。 例如,正如我们所知,名词前面通常是冠词,因此如果给定一个新名词(不在训练数据中),程序会看到它前面的词是冠词,因此将该词标记为名词。 如果有任何疑问、错误或建议,请通过 samyuktaramnath[at]gmail[dot]com 或 hal
【文件预览】:
SentenceParseNew.zip