Lucene的中文分词方法设计与实现

时间:2015-10-05 04:22:25
【文件属性】:
文件名称:Lucene的中文分词方法设计与实现
文件大小:348KB
文件格式:PDF
更新时间:2015-10-05 04:22:25
Lucene 中文分词 本文设计实现了一个中文分词模块,其主要研究目的在于寻找更为有效的中文词汇 处理方法,提高全文检索系统的中文处理能力.整个模块基于当前最流行的搜索引擎架构 Lucene,实现了带有歧义消除功能的正向最大匹配算法.在系统评测方面,比较了该方法与现 有方法的区别,对于如何构建一个高效的中文检索系统,提出了一种实现. 关键词:中文分词;搜索引擎;Lucene;正向最大匹配

网友评论