文件名称:面向层次分类标签的词性标注系统 (2009年)
文件大小:271KB
文件格式:PDF
更新时间:2024-06-10 22:34:46
工程技术 论文
网络的发展导致大量不规则短语文本的产生,针对现有词性标注工具在层次分类体系标签语料上性能不佳的问题,提出一种基于最大熵的简单算法。引入一个新标记,结合从Wordnet和*提取的2类特征,使性能得到提升。实验结果表明,系统在DMoz上的准确率达到93.77%。
文件名称:面向层次分类标签的词性标注系统 (2009年)
文件大小:271KB
文件格式:PDF
更新时间:2024-06-10 22:34:46
工程技术 论文
网络的发展导致大量不规则短语文本的产生,针对现有词性标注工具在层次分类体系标签语料上性能不佳的问题,提出一种基于最大熵的简单算法。引入一个新标记,结合从Wordnet和*提取的2类特征,使性能得到提升。实验结果表明,系统在DMoz上的准确率达到93.77%。