文件名称:延云YDB-运行程序v1.0.1
文件大小:50.27MB
文件格式:ZIP
更新时间:2018-12-20 14:01:09
大数据 云计算 lucene hadoop storm
超千亿规模的数据,数据库根本就运行不了,怎么办? 数据从产生到能够查询,要延迟一天才能看到,如何能做到分钟级延迟? 50台规模的hadoop集群,几亿条数据,一个MR任务要运行几小时,每天也就能进行几百次查询。 如何能让任务的执行时间缩短到秒级响应,每天能执行千万次查询。 Hbase只接受KV形式的存储,数万个维度的大宽表,如何进行多维索引? Storm流计算能预计算固定的维度、粒度,但业务千变万化,突发事件很多,如何对任意维度的组合进行筛选、钻取、统计? 硬盘坏了,机器宕机,怎样做到数据可靠不丢失? 小型机太贵,我们买不起,怎么办? YDB特性 1. 千亿规模 在真实业务环境上验证,每天可达千亿增量,总数据量可达几万亿 。 2. 低延迟 数据从产生到能查询,根据配置的不同一般在十几秒到几分钟。 3. 查询快-高性能 常规查询毫秒级响应 常规统计秒级响应。 4. 实时搜索 长文本字段可以根据关键词进行全文检索模糊匹配,并且有较高的性能。 5. 多维钻取 支持上万个维度,任意组合查询,任意维度组合过滤、分组,统计、排序。 6. 容灾可靠 索引存储在分布式文件系统中,不因硬件的损坏或异常宕机而丢失数据。 7. Sql Api: 更易于上手与使用。