中文信息检索系统的模糊匹配算法研究和实现

时间:2016-11-01 03:35:17
【文件属性】:
文件名称:中文信息检索系统的模糊匹配算法研究和实现
文件大小:303KB
文件格式:PDF
更新时间:2016-11-01 03:35:17
中文信息检索 模糊匹配算法 在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词 匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法 ],针对汉字 拼音输入法中常出现的同音字/近音字混用现象,将算法进一步扩展到广义的Edit Distance上。实验表明,本文提 出的算法能有效提高中文信息检索系统的召回率,在实际应用中可达到“子线性”的效率。

网友评论