文件名称:论文研究-二元语法中文分词数据平滑算法性能研究.pdf
文件大小:680KB
文件格式:PDF
更新时间:2022-09-28 04:17:19
论文研究
将多种平滑算法应用于基于二元语法的中文分词,在1998年1月人民日报语料库的基础上,讨论了困惑度和实际分词性能之间的关系,对比分析各平滑算法的实际性能,结果表明,简单的加值平滑算法性能最优,封闭精度、召回率分别为99.68%、99.7%,开放精度、召回率为98.64%、98.74%。
文件名称:论文研究-二元语法中文分词数据平滑算法性能研究.pdf
文件大小:680KB
文件格式:PDF
更新时间:2022-09-28 04:17:19
论文研究
将多种平滑算法应用于基于二元语法的中文分词,在1998年1月人民日报语料库的基础上,讨论了困惑度和实际分词性能之间的关系,对比分析各平滑算法的实际性能,结果表明,简单的加值平滑算法性能最优,封闭精度、召回率分别为99.68%、99.7%,开放精度、召回率为98.64%、98.74%。