文章原理链接:http://blog.csdn.net/xiaoyu411502/article/details/44803859
自己稍微总结:全文检索主要有两个过程:创建索引,搜索索引
创建索引:
1.让分词组件分词进行分词处理
2.语言处理组件;主要是对得到的词元(Token)做一些同语言相关的处理
3.将得到的词(Term)传给索引组件(Indexer)。
搜索索引:
1.用户输入查询语句 读懂用户搜索意思
2.对查询语句进行词法分析,语法分析,及语言处理。
3.搜索索引,得到符合语法树的文档。
4.根据得到的文档和查询语句的相关性,对结果进行排序。(显示顺序,排名)
------------------------------------------------------------------------------------------
部署 配合链接如何部署 http://blog.csdn.net/xiaoyu411502/article/details/44835119
1.下载 solr最新 http://apache.opencas.org/lucene/solr/ 我此时是5.5.0版本
2.解压进入目录 \solr-5.5.0\solr-5.5.0\example 查看readme 运行命令bin/solr -e dih
3.打开链接 http://localhost:8983/
4.Solr.xml在加载以后,会去根目录下的每个目录进行搜索,直到遇到一个名为core.properties的文件. 发现core.properties文件的目录被当成一个sorlr的实例
创建一个实例:test1 注意Core Admin弹出层的提示信息:instanceDir
and dataDir
need to exist before you can create the core
4.1 咱们拷贝一份已经存在的db目录及内容文件副本,修改名字为test1
4.2 刷新页面可以看到test1
4.3 也可以修改实例的名称:打开test1文件夹下的core.properties文件,添加name=msdb,重新启动进程打开solr命令,则看到msdb
5.操作索引
5.1创建、更新索引
5.2 查询