文件名称:Lucene研究,Lucene 读书笔记
文件大小:496KB
文件格式:DOCX
更新时间:2014-09-06 06:01:14
Lucene
一、 全文检索的基本概念 (1)、数据总体分为两种:结构化数据和非结构化数据。 结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。 (2)、索引(Index):将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。