文件名称:论文研究-无词典中文特征词自动抽取的桥接模式滤除算法.pdf
文件大小:137KB
文件格式:PDF
更新时间:2022-08-11 16:58:22
自动分词,桥接模式滤除算法,中文信息处理
提出一种不依赖于词典的抽取文本特征词的桥接模式滤除算法(BPFA)。该算法统计文本中的汉字结合模式及其出现频率,通过消除桥接频率得到模式的支持频率,并依此来判断和提取正确词语。实验结果显示,BPFA能够有效提高分词结果的查准率和查全率。该算法适用于对词语频率敏感的中文信息处理应用,如文本分类、文本自动摘要等。