ES性能测试

时间:2022-08-28 10:58:04
测试背景
 
  因为ES(ElasticSearch)前段时间查询效率有点慢,技术小组对索引做了一些改动,因此需要测试一下修改后的查询效率,跟之前的结果做一下对比,所以有了这次测试。
 
需求简述
  本文主要是分享一下我做测试的一些过程和思考,这里的需求不理解不影响阅读下文。
  1. 只测试通过车辆查询的一种场景,不考虑二次识别。
  2. 测试基础数据为近一年的数据(76亿左右)。测试的时段选择(一周、半月、一月、三月、半年、一年及全部数据)
  3. 测试的卡口选择全部。
  4. 测试的号牌号码为此前根据过车数量获取的前100000条数据中随机抽取,另外,90%的查询为有号牌查询,10%的查询为无号牌查询。
  5. 未对车道和方向进行过滤。
  6. 测试时没有同时进行插入操作。
用表来描述就是:

ES性能测试

 
准备工作
需要跟技术小组提供在ES中查询用到的jquery语句。
在ES中查询车牌鲁B8070K在2016-09-13T00:20:44.000Z", --2016-09-14T00:20:44.000Z"内的过车数据,使用的jquery语句如下:
 {
"query": {
"bool": {
"must": [
{
"range": {
"t_pass_data.insertTime": {
"from": "2016-09-13T00:20:44.000Z",
"to": "2016-09-14T00:20:44.000Z"
}
}
}
],
"must_not": [],
"should": []
}
},
"filter": {
"bool": {
"must": [
{
"term": {
"t_pass_data.plateNumNond": "鲁B8070K"
}
}
]
}
},
"from": 0,
"size": 10,
"sort": [
{
"snapTime": {
"order": "desc"
}
}
],
"facets": {}
}
分析过程
 
这个例子中,要实现需求的目标,有1点需要注意,即时间段和车牌需要实现随机,以避免查询缓存造成的影响。
车牌的随机,实现的方法很简单,实现的思路是从数据库中查询出过车数最多的top 10W个车牌,使用参数化方式实现。

而对于时间的随机,因为对于loadrunner中的日期函数并不了解,所以在度娘中输入“loadrunner 日期”进行查询,幸运的是第一篇文章就出现了有价值的信息(http://www.cnblogs.com/qmfsun/p/4563703.html) ,这里面提到了一个函数lr_save_datetime。到这里还不确定该函数是否可用,因为从文章中看来它取的是一个特定的时间点,而非我想要的一个时间段。 为了得到更多的信息,我查了一下LR的帮助文档,得到的信息如下:

In the following example, lr_save_datetime retrieves tomorrow's date.
lr_save_datetime("Tomorrow is %B %d %Y", DATE_NOW + ONE_DAY, "next");
lr_output_message(lr_eval_string("{next}"));
If today is January 7th, , these lines will return the message: Tomorrow is January .

信息还是不够, 又找度娘问了一下这个函数的用法,找到了这一篇:http://www.cnblogs.com/qmfsun/p/4561705.html 。

这文章里有这样一句话: lr_save_datetime将当前日期和时间,或具有指定偏移的日期和时间保存在参数中。看到这里,我明白问题已经解决了一半了,即如果定义了一个“开始时间”,可以使用这个函数偏移量的设置方法得到一个结束时间。那么怎么得到开始时间呢?并且让它是在一年内随机的一个时间点?

刚开始我想的是两条路:第一条是定义几个随机数字,然后组合成日期时间的格式,这种方法后来因为没找到怎么组合而放弃; 第二条路是利用
lr_save_datetime(const char *format, int offset, const char *name) 这个函数,只是把里面的 offset 用一个随机的日期来替换(上面的两个链接中,这个offset用的都是DATE_NOW),后来也因为没找到替换的对象而失败。。。这个问题纠结了一下午,后来在吃饭的时候忽然灵光一闪想到了解决方法, 同时也对自己半下午的努力苦笑连连——只要在这个函数中,用DATE_NOW 减去一个随机数字不就行了嘛,就这么简单竟然让我苦恼了半下午,深深的对自己无语。。。

 int mon,day,hour; //定义时间变量
mon=atoi( lr_eval_string("<mon>"));//0-6
day=atoi( lr_eval_string("<day>"));//1-30
hour=atoi( lr_eval_string("<hour>"));//1-24
//随机取半年内的一个时间作为结束时间
lr_save_datetime("随机结束时间: %Y-%m-%dT%H:%M:%S", DATE_NOW-mon*day*hour*(ONE_HOUR), "endDate");
//计算出一周前时间作为开始时间
lr_save_datetime("随机开始时间: %Y-%m-%dT%H:%M:%S", DATE_NOW-mon*day*hour*(ONE_HOUR)-*ONE_DAY, "beginDate");

最终完整的脚本是:

 Action()
{
//随机半个月 的过车数据查询,无车牌 ,全部卡口,不考虑车道、方向
int mon,day,hour; //定义时间变量
mon=atoi( lr_eval_string("<mon>"));//0-6
day=atoi( lr_eval_string("<day>"));//1-30
hour=atoi( lr_eval_string("<hour>"));//1-24
//随机取半年内的一个时间作为结束时间
lr_save_datetime("随机结束时间: %Y-%m-%dT%H:%M:%S", DATE_NOW-mon*day*hour*(ONE_HOUR), "endDate");
//计算出一周前时间作为开始时间
lr_save_datetime("随机开始时间: %Y-%m-%dT%H:%M:%S", DATE_NOW-mon*day*hour*(ONE_HOUR)-*ONE_DAY, "beginDate"); //lr_output_message("%s",lr_eval_string("<beginDate>")); //打印开始时间
//lr_output_message("%s",lr_eval_string("<endDate>")); //打印结束时间 lr_rendezvous("rendezvous");//插入集合点 lr_start_transaction("无车牌查询"); //插入事务 web_reg_find("Text=dataSource", //插入检查点
"Search=Body",
LAST ); web_url("www.abc.com", //主节点为7和9, 数据节点27 "URL=http://IP:PORT/_search?{%22query%22:{%22bool%22:{%22must%22:[{%22range%22:{%22t_pass_data.insertTime%22:{%22from%22:%22<beginDate>.000Z%22,%22to%22:%22<endDate>.000Z%22}}}],%22must_not%22:[],%22should%22:[]}},%22filter%22:{%22bool%22:{%22must%22:[]}},%22from%22:0,%22size%22:10,%22sort%22:[{%22snapTime%22:{%22order%22:%22desc%22}}],%22facets%22:{}}", "TargetFrame=", //"TargetBrowser=Mercury Technologies", "Resource=0", "RecContentType=application/json; charset=UTF-8", "Snapshot=t1.inf", "Mode=HTML", LAST ); lr_end_transaction("无车牌查询", LR_AUTO); //打印出使用的车牌号码
//lr_output_message( "using CAR #%s",lr_eval_string( "<CarNumber>" ));
return ;
}
搞定,收工!
 
说在后面的话
  等有时间准备跟搞C的同事聊一聊,LR里面很多时候需要用到C的东西,看看就这个问题上是否还有更好的解决思路。另外,欢迎来赐教对于这个问题你的解决思路,~~
 
欢迎加我个人的微信公众号来交流:
ES性能测试

ES性能测试的更多相关文章

  1. 将不确定变为确定~老赵写的CodeTimer是代码性能测试的利器

    首先,非常感谢赵老大的CodeTimer,它让我们更好的了解到代码执行的性能,从而可以让我们从性能的角度来考虑问题,有些东西可能我们认为是这样的,但经理测试并非如何,这正应了我之前的那名话:“机器最能 ...

  2. Spark2&period;2&plus;ES6&period;4&period;2(三十一):Spark下生成测试数据,并在Spark环境下使用BulkProcessor将测试数据入库到ES

    Spark下生成2000w测试数据(每条记录150列) 使用spark生成大量数据过程中遇到问题,如果sc.parallelize(fukeData, 64);的记录数特别大比如500w,1000w时 ...

  3. 分库代价高的情况下,如何优化ES解决亿级数据量检索

    数据平台已迭代三个版本,从一开始遇到很多常见的难题,到现在终于有片段时间整理一些已完善的文档,在此分享以供所需朋友的实现参考,但愿能帮助大家少走些弯路,在此篇幅中偏重于ElasticSearch的优化 ...

  4. GT性能测试Android版使用说明

    1 GT简介 GT(随身调) Android版是腾讯 MIG 专项测试组自行研发的 Android APP 随身调测平台,它是直接运行在手机上的“集成调测环境”(ITE, Integrated Tes ...

  5. 厉害了,ES 如何做到几十亿数据检索 3 秒返回!

    一.前言 数据平台已迭代三个版本,从头开始遇到很多常见的难题,终于有片段时间整理一些已完善的文档,在此分享以供所需朋友的 实现参考,少走些弯路,在此篇幅中偏重于ES的优化,关于HBase,Hadoop ...

  6. es技术规划

    一.业务背景 es服务当前没有专门的部门负责维护和开发,交由各端自行负责维护,随着公司业务查询和统计需求非常多,会面临居多方面问题和挑战: 无人(专业RD或部门)负责 无专业的人进行维护,遇到问题几乎 ...

  7. 上亿数据怎么玩深度分页?兼容MySQL &plus; ES &plus; MongoDB

    面试题 & 真实经历 面试题:在数据量很大的情况下,怎么实现深度分页? 大家在面试时,或者准备面试中可能会遇到上述的问题,大多的回答基本上是分库分表建索引,这是一种很标准的正确回答,但现实总是 ...

  8. 【AR实验室】OpenGL ES绘制相机(OpenGL ES 1&period;0版本)

    0x00 - 前言 之前做一些移动端的AR应用以及目前看到的一些AR应用,基本上都是这样一个套路:手机背景显示现实场景,然后在该背景上进行图形学绘制.至于图形学绘制时,相机外参的解算使用的是V-SLA ...

  9. Ignite性能测试以及对redis的对比

    测试方法 为了对Ignite做一个基本了解,做了一个性能测试,测试方法也比较简单主要是针对client模式,因为这种方法和使用redis的方式特别像.测试方法很简单主要是下面几点: 不作参数优化,默认 ...

随机推荐

  1. hive 记事本

    hive 0.12 load data overwrite 直接覆盖了数据,不进回收站..... 手动load data 不加overwrite

  2. IIS7&period;5 HTTP错误403&period;1-Forbidden 您尝试从某个目录运行CGI、ISAPI或其他可执行程序,但该目录不允许运行可执行文件

    ----------------错误详细---------------------------------------------------------------- --------------- ...

  3. centos下的防火墙配置

    1,查看防火墙文件: vim /etc/sysconfig/iptables # Generated by iptables-save v1. :: *filter :INPUT ACCEPT [:] ...

  4. js 获取元素在页面上的偏移量的最佳方式

    使用js制作效果时,我们常常要获取某个元素在页面上的偏移量(例如tip提示框功能).而获取偏移量可以直接获取相对于document的偏移量,也可以获取相对与视口的偏移量(viewpoint)加上页面滚 ...

  5. c&num; 鼠标操作

    1#region 3using System; 4using System.Runtime.InteropServices; 6#endregion 8namespace Windows.Forms. ...

  6. oracle &quot&semi;记录被另一个用户锁定&quot&semi;

    出现的原因是有人对某一条数据进行了修改,oracle会通过这个事务记住这条数据,若修改的人没有进行提交或进行回滚记录,oracle是不允许对这条数据在此进行修改的,在这种情况下你要进行修改数据,则会被 ...

  7. eclipse中hibernate和mybatis中xml配置文件的没有标签提醒解决方法

    当我们使用eclipse编写Mybatis或hibernate的xml文件时,面对众多标签的配置文件,却没有自动提醒,对于工作和学习都十分不方便. 之所以没有自动提醒,是因为dtd文件没有加载成功. ...

  8. 使用spark ml pipeline进行机器学习

    一.关于spark ml pipeline与机器学习 一个典型的机器学习构建包含若干个过程 1.源数据ETL 2.数据预处理 3.特征选取 4.模型训练与验证 以上四个步骤可以抽象为一个包括多个步骤的 ...

  9. 【一天一道LeetCode】&num;342&period; Power of Four

    一天一道LeetCode 本系列文章已全部上传至我的github,地址:ZeeCoder's Github 欢迎大家关注我的新浪微博,我的新浪微博 欢迎转载,转载请注明出处 (一)题目 Given a ...

  10. Redis安装部署、Jedis的使用

    一.NoSQL概述 为什么需要NoSQL High performance -高并发读写 Huge Storage - 海量数据的高效率存储和访问 High Scalability &&amp ...