package ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
/**
* @Project JobsOtherWebSearch
* @Package
* @ClassName: SearchJobs
* @Author fjsh
* @Description: 对solr中的各个功能进行测试
* @Date 2014-3-5 下午3:38:09
*/
public class SearchJobs {
private static String url = "jdbc:sqlserver://192.168.2.106:1433;DatabaseName=JobsOtherweb51jobDB";
private static String user = "sa";
private static String password = "sa";
private String Corenum;
public static int JobsId = 219443;// start jobsid
public SolrServer solrServer = null;// new
// HttpSolrServer("http://192.168.2.100:8080/solr/JobsOtherWeb1");
// 1、 创建solrserver对象:
public SolrServer createSolrServer() {
HttpSolrServer solr = null;
try {
solr = new HttpSolrServer(
"http://192.168.2.106:8080/solr/JobsOtherWeb0");
(100);
(100);
(100);
} catch (Exception e) {
("请检查tomcat服务器或端口是否开启!");
();
}
return solr;
}
// 简单的查询,取出二十个
public void querytop20() {
solrServer = createSolrServer();
("简单查询取出前二十个");
String dtStart = new SimpleDateFormat("yyyyMMddHHmmssSSS")
.format(new Date());
("开始时间:" + dtStart + "\n");
try {
SolrQuery query = new SolrQuery();// 查询
("jobsName:计算机");
(20);
SolrDocumentList docs = (query).getResults();
for (SolrDocument sd : docs) {
(("jobsName"));
(("publishDate"));
}
();
String dtEnd = new SimpleDateFormat("yyyyMMddHHmmssSSS")
.format(new Date());
(query);
} catch (SolrServerException e) {
// TODO Auto-generated catch block
();
}
}
// 删除索引
// 据查询结果删除:
public void DeleteByQuery() {
solrServer = createSolrServer();
try {
// 删除所有的索引
("jobsName:高级技术支持");
();
} catch (Exception e) {
();
}
}
// 根据索引号删除索引:
public void DeleteByQueryJobsId() {
solrServer = createSolrServer();
try {
("515792");
();
} catch (Exception e) {
();
}
}
// 查询
// SolrJ提供的查询功能比较强大,可以进行结果中查询、范围查询、排序等。
// 补充一下范围查询的格式:[star t TO end],start与end是相应数据格式的值的字符串形式,“TO” 一定要保持大写!
/*
* field 查询的字段名称数组 key 查询的字段名称对应的值 start 查询的起始位置 count 一次查询出来的数量 sortfield
* 需要排序的字段数组 flag 需要排序的字段的排序方式如果为true 升序 如果为false 降序 hightlight 是否需要高亮显示
*/
public QueryResponse Search(String[] field, String[] key, int start,
int count, String[] sortfield, Boolean[] flag, Boolean hightlight) {
solrServer = createSolrServer();
// 检测输入是否合法
if (null == field || null == key || != ) {
return null;
}
if (null == sortfield || null == flag
|| != ) {
return null;
}
SolrQuery query = null;
try {
// 初始化查询对象
query = new SolrQuery(field[0] + ":" + key[0]);
for (int i = 0; i < ; i++) {
(field[i] + ":" + key[i]);
}
// 设置起始位置与返回结果数
(start);
(count);
// 设置排序
for (int i = 0; i < ; i++) {
if (flag[i]) {
(sortfield[i], );
} else {
(sortfield[i], );
}
}
// 设置高亮
if (null != hightlight) {
(true); // 开启高亮组件
("jobsName");// 高亮字段
("<font color=\"red\">");// 标记
("</font>");
(1);// 结果分片数,默认为1
(1000);// 每个分片的最大长度,默认为100
}
} catch (Exception e) {
();
}
QueryResponse rsp = null;
try {
rsp = (query);
} catch (Exception e) {
();
return null;
}
// 返回查询结果
return rsp;
}
// Facet的一个应用:自动补全
// prefix为前缀,min为最大返回结果数
// field需要查询并返回不全的字段,prefix需要查询并返回的字段不全值
public String[] autoComplete(String field, String prefix, int min) {
/*------------第一处标记------------------------*/
solrServer = createSolrServer();
String words[] = null;
StringBuffer sb = new StringBuffer("");
SolrQuery query = new SolrQuery(field + ":" + prefix);
QueryResponse rsp = new QueryResponse();
// Facet为solr中的层次分类查询
/*------------第二处标记:程序从第一处标记执行到这里需要300ms所以将上面的代码进行实例化最好------------------------*/
try {
(true);
// ("*:*");
query = new SolrQuery(field + ":" + prefix);
(prefix);
(field);
rsp = (query);
/*------------第三处标记:程序从第二处标记执行到这里需要200ms但此处很难再进行优化,由于查询的复杂性------------------------*/
} catch (Exception e) {
// TODO: handle exception
();
return null;
}
if (null != rsp) {
FacetField ff = (field);
List<Count> countList = ();
if (null == countList) {
return null;
}
for (int i = 0; i < (); i++) {
String tmp[] = (i).toString().split(" ");
// 排除单个字
if (tmp[0].length() < 2) {
continue;
}
(tmp[0] + " ");
min--;
if (min == 0) {
break;
}
}
words = ().split(" ");
} else {
return null;
}
return words;
}
/**
* @Author fjsh
* @Title SearchGroup
* @Description 按group进行查找
* @param QUERY_CONTENT 查询内容
* @param QUERY_ROWS 查找的数量,默认是10
* @param GROUP true or false 是否按group查询
* @param GROUP_FIELD 查询field
* @param GROUP_LIMIT The number of results (documents) to return for each group. Defaults to 1
* @Return void
* @Throws
* @Date 2014-5-7
* 输出结果的时候,由于定义的数据索引没有做很好是调整,显示的结果并不理想,不过此方法可以作为参考
*/
public void SearchGroup(String QUERY_CONTENT,int QUERY_ROWS, Boolean GROUP, String GROUP_FIELD,String GROUP_LIMIT) {
SolrServer server = createSolrServer();
SolrQuery param = new SolrQuery();
("jobsName:"+QUERY_CONTENT);
(QUERY_ROWS);
(, GROUP);
(GroupParams.GROUP_FIELD, GROUP_FIELD);
(GroupParams.GROUP_LIMIT, GROUP_LIMIT);
QueryResponse response = null;
try {
response = (param);
} catch (SolrServerException e) {
// ((), e);
}
Map<String, Integer> info = new HashMap<String, Integer>();
GroupResponse groupResponse = ();
if(groupResponse != null) {
List<GroupCommand> groupList = ();
for(GroupCommand groupCommand : groupList) {
List<Group> groups = ();
for(Group group : groups) {
((), (int)().getNumFound());
(()+"---"+().getNumFound());
}
}
}
}
/*
* 介绍了一下facet之后,来说说怎么实现facet。facet的实现其实很简单,主要在搜索参数上带上就OK。
*
* facet=on/true #代表开启facet =cate #代表要统计的面(分组),比如上面的分类,品牌,可以多次出现
* =20 #每个分组最多返回条数 = 1 #这个表示分组下某一条目的最小数据量
* = on/true #统计null的值 = #默认为fc, fc表示Field Cache
* 比如
* :http://localhost/product/select/?q=铁观音&facet=on&=category&facet
* .field=brand&=1在搜索结果中返回xml的facet结果
*
*
* view sourceprint? 01 <lst name="facet_counts"> 02 <lst
* name="facet_queries"/> 03 <lst name="facet_fields"> 04 <lst
* name="category"> 05 <int name="2742">64</int> 06 <int name="793">48</int>
* 07 <int name="2741">12</int> 08 <int name="801">6</int> 09 <int
* name="1087">1</int> 10 </lst> 11 <lst name="brand"> 12 <int
* name="229">74</int> 13 <int name="227">16</int> 14 <int
* name="270">13</int> 15 <int name="317">10</int> 16 <int name="0">4</int>
* 17 <int name="165">4</int> 18 <int name="203">3</int> 19 <int
* name="147">2</int> 20 <int name="166">2</int> 21 <int name="217">1</int>
* 22 <int name="342">1</int> 23 <int name="343">1</int> 24 </lst> 25 </lst>
* <lst name="category"> 分组名 <int name="2742">64</int>
* 分组内条目,name表示条目,64是统计结果数。
*
*
*
*
* Date Facet 日期类型的字段在文档中很常见 , 如商品上市时间 , 货物出仓时间 , 书籍上架时间等等 . 某些情况下需要针对这些字段进行
* Facet. 不过时间字段的取值有无限性 , 用户往往关心的不是某个时间点而是某个时间段内的查询统计结果 . Solr
* 为日期字段提供了更为方便的查询统计方式 . 当然 , 字段的类型必须是 DateField( 或其子类型 ). 需要注意的是 , 使用 Date
* Facet 时 , 字段名 , 起始时间 , 结束时间 , 时间间隔这 4 个参数都必须提供 . 与 Field Facet 类似 ,Date
* Facet 也可以对多个字段进行 Facet. 并且针对每个字段都可以单独设置参数 . 2.1 该参数表示需要进行 Date
* Facet 的字段名 , 与 一样 , 该参数可以被设置多次 , 表示对多个字段进行 Date Facet. 2.2
* 起始时间 , 时间的一般格式为 ” 1995-12-31T23:59:59Z”, 另外可以使用
* ”NOW”,”YEAR”,”MONTH” 等等 , 具体格式可以参考 . DateField 的
* java doc. 2.3 结束时间 . 2.4 时间间隔 . 如果 start 为
* 2009-1-1,end 为 设置为 ”+1MONTH” 表示间隔 1 个月 , 那么将会把这段时间划分为 12
* 个间隔段 . 注意 ”+” 因为是特殊字符所以应该用 ”%2B” 代替 . 2.5 取值可以为
* true|false, 默认为 false. 它表示 gap 迭代到 end 处采用何种处理 . 举例说明 start 为
* 2009-1-1,end 为 2009-12-25,gap 为 ”+1MONTH”,hardend 为 false 的话最后一个时间段为
* 2009-12-1 至 2010-1-1;hardend 为 true 的话最后一个时间段为 2009-12-1 至 2009-12-25.
* 2.6 取值范围为 before|after|between|none|all, 默认为 none.
* before 会对 start 之前的值做统计 . after 会对 end 之后的值做统计 . between 会对 start 至 end
* 之间所有值做统计 . 如果 hardend 为 true 的话 , 那么该值就是各个时间段统计值的和 . none 表示该项禁用 . all 表示
* before,after,all 都会统计 . 举例 : &facet=on &=date
* &=2009-1-1T0:0:0Z &=2010-1-1T0:0:0Z
* &=%2B1MONTH &=all
*/
public void FacetFieldQuery() throws Exception {
solrServer = createSolrServer();
SolrQuery query = new SolrQuery();// 建立一个新的查询
("jobsName:计算机维护");
(true);// 设置facet=on
// 分类信息分为:薪水,发布时间,教育背景,工作经验,公司类型,工作类型
(new String[] { "salary", "publishDate",
"educateBackground", "jobExperience", "companytype", "jobsType" });// 设置需要facet的字段
(10);// 限制facet返回的数量
(false);// 不统计null的值
(1);// 设置返回的数据中每个分组的数据最小值,比如设置为1,则统计数量最小为1,不然不显示
// ("publishDate:[2014-04-11T00:00:00Z TO 2014-04-13T00:00:00Z]");
QueryResponse response = (query);
("查询时间:" + ());
List<FacetField> facets = ();// 返回的facet列表
for (FacetField facet : facets) {
(());
("----------------");
List<Count> counts = ();
for (Count count : counts) {
(() + ":" + ());
}
();
}
}
// 时间片使用方法
public void FacetFieldQueryDate() throws Exception {
solrServer = createSolrServer();
SolrQuery query = new SolrQuery();// 建立一个新的查询
("jobsName:计算");
(true);// 设置facet=on
(10);// 限制facet返回的数量
(false);// 不统计null的值
(1);// 设置返回的数据中每个分组的数据最小值,比如设置为1,则统计数量最小为1,不然不显示
(new String[] { "salary", "educateBackground",
"jobExperience", "companytype", "jobsType" });// 设置需要facet的字段
// ("publishDate:[2014-04-21T00:00:00Z TO 2014-04-23T00:00:00Z]");
// ("publishDate:[2014-04-11T00:00:00Z TO 2014-04-13T00:00:00Z]");
SimpleDateFormat time0 = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
SimpleDateFormat time1 = new SimpleDateFormat("yyyy-MM-dd");
SimpleDateFormat time2 = new SimpleDateFormat("HH:mm:ss");
// return
// ()+"-"+()+"-"+()+"T"+()+":"+()+":"+();
Calendar c = ();
(((()) + " 23:59:59"));
Date date = ();
String dateNow = (date) + "T" + (date) + "Z";
(((()) + " 23:59:59"));
(, -1);
date = ();
// 当天
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -2);
date = ();
// 前三天
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -4);
date = ();
// 前一周
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -7);
date = ();
// 前两周
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -16);
date = ();
// 前一个月
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -30);
date = ();
// 前两个月
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
QueryResponse response = (query);
("查询时间:" + ());
List<FacetField> facets = ();// 返回的facet列表
for (FacetField facet : facets) {
(());
("----------------");
List<Count> counts = ();
for (Count count : counts) {
(() + ":" + ());
}
();
}
// 根据时间段来获取数据
Map<String, Integer> maps = ();
for (Entry<String, Integer> entry : ()) {
(() + ":" + ());
}
}
// 最终使用的查询方式
// SolrJ提供的查询功能比较强大,可以进行结果中查询、范围查询、排序等。
// 补充一下范围查询的格式:[star t TO end],start与end是相应数据格式的值的字符串形式,“TO” 一定要保持大写!
/*
* field 查询的字段名称数组 key 查询的字段名称对应的值 start 查询的起始位置 count 一次查询出来的数量 sortfield
* 需要排序的字段数组 flag 需要排序的字段的排序方式如果为true 升序 如果为false 降序 hightlight 是否需要高亮显示
*/
public QueryResponse searchResult(String[] field, String[] key, int start,
int count, String[] sortfield, Boolean[] flag, Boolean hightlight)
throws Exception {
solrServer = createSolrServer();
// 检测输入是否合法
if (null == field || null == key || != ) {
return null;
}
SolrQuery query = null;
try {
// 初始化查询对象
query = new SolrQuery(field[0] + ":" + key[0]);
for (int i = 0; i < ; i++) {
(field[i] + ":" + key[i]);
}
// 设置起始位置与返回结果数
(start);
(count);
// 设置排序
if (!(null == sortfield || null == flag
|| != )) {
for (int i = 0; i < ; i++) {
if (flag[i]) {
(sortfield[i], );
} else {
(sortfield[i], );
}
}
}
// 设置高亮
if (null != hightlight) {
(true); // 开启高亮组件
("jobsName");// 高亮字段
("<font color=\"red\">");// 标记
("</font>");
(1);// 结果分片数,默认为1
(1000);// 每个分片的最大长度,默认为100
}
} catch (Exception e) {
();
}
(true);// 设置facet=on
(10);// 限制facet返回的数量
(false);// 不统计null的值
(1);// 设置返回的数据中每个分组的数据最小值,比如设置为1,则统计数量最小为1,不然不显示
(new String[] { "salary", "educateBackground",
"jobExperience", "companytype", "jobsType" });// 设置需要facet的字段
// ("publishDate:[2014-04-21T00:00:00Z TO 2014-04-23T00:00:00Z]");
// ("publishDate:[2014-04-11T00:00:00Z TO 2014-04-13T00:00:00Z]");
SimpleDateFormat time0 = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
SimpleDateFormat time1 = new SimpleDateFormat("yyyy-MM-dd");
SimpleDateFormat time2 = new SimpleDateFormat("HH:mm:ss");
// return
// ()+"-"+()+"-"+()+"T"+()+":"+()+":"+();
Calendar c = ();
(((()) + " 23:59:59"));
Date date = ();
String dateNow = (date) + "T" + (date) + "Z";
(((()) + " 23:59:59"));
(, -1);
date = ();
// 当天
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -2);
date = ();
// 前三天
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -4);
date = ();
// 前一周
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -7);
date = ();
// 前两周
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -16);
date = ();
// 前一个月
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
(, -30);
date = ();
// 前两个月
("publishDate:[" + (date) + "T"
+ (date) + "Z" + " TO " + dateNow + "]");
QueryResponse rsp = null;
try {
rsp = (query);
("此次查询时间qtime :" + ());
List<FacetField> facets = ();// 返回的facet列表
for (FacetField facet : facets) {
(());
("----------------");
List<Count> counts = ();
for (Count countitem : counts) {
(() + ":"
+ ());
}
();
}
// 根据时间段来获取数据
Map<String, Integer> maps = ();
for (Entry<String, Integer> entry : ()) {
(() + ":" + ());
}
// 获取返回的结果
SolrDocumentList docs = ();
for (SolrDocument doc : docs) {
("-----");
(("jobsName"));
(("publishDate"));
}
} catch (Exception e) {
();
return null;
}
// 返回查询结果
return rsp;
}
}