基于Java的搜索引擎Nutch中文搜索技术研究

时间:2011-10-31 04:26:53
【文件属性】:
文件名称:基于Java的搜索引擎Nutch中文搜索技术研究
文件大小:12KB
文件格式:TXT
更新时间:2011-10-31 04:26:53
Nutch 基于Java的搜索引擎Nutch中文搜索技术研究 摘要:Nutch是一个优秀的基于Java的开放源码搜索引擎,为了使它能够支持中文搜索,本文在分析了Nutch结构的基础上,采用词表分词技术和前向匹配分词算法对中文信息进行分词,以JavaCC脚本实现上下文相关文法中文分析模块,成功实现了Nutch中文搜索功能。 关键词:搜索引擎; 分词; 正规

网友评论

  • 搜索引擎可用、就是不太会用。
  • 一篇论文而已
  • 搜索引擎可用、就是不太会用。