文件名称:论文研究-综合最大匹配和歧义检测的中文分词粗分方法.pdf
文件大小:478KB
文件格式:PDF
更新时间:2022-09-26 18:48:46
论文研究
中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题,在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规模,为进一步正确分词奠定基础。通过公共语料库数据集的实验对比,取得很好的效果。
文件名称:论文研究-综合最大匹配和歧义检测的中文分词粗分方法.pdf
文件大小:478KB
文件格式:PDF
更新时间:2022-09-26 18:48:46
论文研究
中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题,在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规模,为进一步正确分词奠定基础。通过公共语料库数据集的实验对比,取得很好的效果。