文件名称:基于统计规则的交集型歧义处理方法 (2006年)
文件大小:418KB
文件格式:PDF
更新时间:2024-06-14 02:36:38
自然科学 论文
中文分词是中文信息处理的基础,歧义问题是中文分词的一个难点,而交集型歧义问题占歧义问题的90%以上,因此对交集型歧义问题的研究是中文分词研究的一个重点。通过反复的实验和对实验结果的分析,提出了5条规则,并根据这5条规则给出了一种针对交集型歧义字段切分的算法,实验结果表明,基于该算法实现的分词系统DSfenci,对于交集型歧义消解的准确率高于95.22%。