亿级数据相关文章

MySQL 亿级数据导入导出及迁移笔记
时间：2022-11-10 20:29:39
上周被安排做了一个MySQL亿级数据的迁移，特此记录一下，导入和导出是两个过程，本文想详细的介绍一下具体的使用，感兴趣的小伙伴们可以参考一下
如何使用分区处理MySQL的亿级数据优化
时间：2022-11-06 13:39:50
mysql在查询上千万级数据的时候，通过索引可以解决大部分查询优化问题。但是在处理上亿数据的时候，应该怎么解决，本文就是用分区来优化一下，感兴趣的一起来了解一下
MySQL单表亿级数据分页怎么优化？
时间：2022-11-04 14:47:53
有人说单表超千万数据就应该分库分表了，这么玩不合理啊。但是对于创新业务来讲，业务系统的设计不可能一上来就预估这么大的容量，成本和工期都不足矣完成系统的开发工作。我觉得对于创新型业务系统的设计，首先满足需
毫秒间查询千亿级Trace数据，SkyWalking上链路追踪这么强？
时间：2022-11-02 11:07:44
一、开篇自从SkyWalking开始在公司推广，时不时会在排查问题的人群中听到这样的话：“你咋还没接SkyWalking？接入后，一眼就看出是哪儿的问题了…"，正如同事所说的，在许多情况下，SkyWalking就是这么秀。作为实践者，我非常感谢SkyWalking，因为这款国产全链路监控产品给公司的...
Redis系列8：Bitmap实现亿万级数据计算
时间：2022-10-31 15:07:56
Redis系列1：深刻理解高性能Redis的本质Redis系列2：数据持久化提高可用性Redis系列3：高可用之主从架构Redis系列4：高可用之Sentinel(哨兵模式）Redis系列5：深入分析Cluster 集群模式追求性能极致：Redis6.0的多线程模型追求性能极致：客户端缓存带来的革...
标签：Redis 缓存架构与思维
Spark千亿级数据去重，性能优化踩坑之路
时间：2022-10-27 15:07:45
大家好，我是狗哥，今天给大家写一点干货，这次咱们就从0-1把思路给大家讲一下，这也是我同事在数据开发中踩过的坑，希望能帮助到大家。先虚拟一个业务场景，方便大家思考我举个例子，拿京东或者淘宝说吧，如果你的业务让你计算几个维度(广告位置、小时、广告类型等等吧，我就随便举个例子)，每个维度的数据uv量级，...
挑战海量数据：基于Apache DolphinScheduler对千亿级数据应用实践
时间：2022-10-11 17:10:21
点亮 ⭐️ Star · 照亮开源之路 GitHub:https://github.com/apache/dolphinscheduler 精彩回顾近期，初灵科技的大数据开发工程师钟霈合在社区活动的线上 Meetup 上中，给大家分享了《基于 Apache DolphinScheduler 对千...
挑战海量数据：基于Apache DolphinScheduler对千亿级数据应用实践
时间：2022-10-11 17:06:45
点亮 ⭐️ Star · 照亮开源之路GitHub:https://github.com/apache/dolphinscheduler精彩回顾近期，初灵科技的大数据开发工程师钟霈合在社区活动的线上 Meetup 上中，给大家分享了《基于 Apache DolphinScheduler 对千亿级数据...
“一个扫描枪一张表”，韵达选择 TDengine 应对每日亿级数据量
时间：2022-09-30 20:10:02
小 T 导读：此前，韵达使用 MySQL 分区+索引处理订单数据的方式遭受到了挑战，面对每日亿级的数据量，MySQL 显然已经无法满足当下的数据处理需求。为更好地发展业务，在此基础上韵达新增了 TDengine 的数据源，用专业的数据库来进行时序数据的处理。作为一家头部物流公司，韵达每日...
如何用elasticsearch构架亿级数据采集系统（第1集：非生产环境windows安装篇）
时间：2022-09-29 08:38:41
（一）做啥的？基于Elasticsearch，可以为实现，大数据量(亿级)的实时统计查询的方案设计，提供底层数据框架。本小节jacky会在非生产环境下，在 window 系统下，给大家分享着部分的相关内容。（二）Elasticsearch的安装2.1 版本选择:elasticsearch-rtf第1...
开源IndexR:如何对上千亿的数据进行秒级探索式分析
时间：2022-09-16 07:28:28
目前，行业中的大数据分析架构一般使用基于 Hadoop 体系的分布式计算引擎 + 分布式存储系统架构（如下图）。 Hadoop 体系的架构特点是上层解决计算问题，下层解决存储问题。它可以让开发者在不了解分布式底层细节的情况下，进行分布式程序的开发。但是，这种架构同时也存在一些问题：整合工...
亿级高并发数据库调优与最佳实践法则
时间：2022-09-08 14:00:41
做业务，要懂基本的SQL语句；做性能优化，要懂索引，懂引擎；做分库分表，要懂主从，懂读写分离… 数据库的使用，是开发人员的基本功，对它掌握越清晰越深入，你能做的事情就越多。今天我们用10分钟，重点梳理一遍以下几方面：数据库知识点汇总；数据库事务特性和隔离级别；详解关系型数据库、索引与锁机制；...
百亿数据毫秒响应级交易系统读写分离存储数据设计
时间：2022-09-04 20:02:09
刚完成了一个存储百亿级数据，响应时间要求10毫秒内的交易系统数据存储设计方案，现在有空整理一下思维。一、分库分表 1.实时数据和历史数据分离分为ABC表，AB表每日日切，只存储1天数据，每到24点切另外1张表。C表存储历史数据，T-1数据日终批量AB表迁移至C表这样实现动态数据和静态数据之间的...
上亿条数据（GB级）文件去重解决方案
时间：2022-09-03 17:18:10
1.准备待处理的文件 2.随便一个文件都有100000000条数据库，如果直接去重非常麻烦 3.一段php代码解决问题 define('FileIn', $argv[1]);$time_start = microtime(true);$count = 0;function dump...
mysql数据库如何实现亿级数据快速清理
时间：2022-08-28 07:46:54
这篇文章主要介绍了mysql数据库实现亿级数据快速清理的方法，非常不错，具有参考借鉴价值，需要的朋友参考下吧
mogodb亿万级数据性能測试
时间：2022-06-07 05:28:55
本机i7四核8G废话少说mogodb最像sql的nosql使用批量插入一次20万循环10次总共200万数据用时65秒（尝试一次50万只是报内存溢出了，原因未知）插入2000万数据用时10分钟左右，这是内存占用90%,重新启动之后mongodb又回到20%预计是缓存问题2000万数据下查询在加索引情况...
Linux下和MySQL下利用python插入亿万级数据
时间：2022-03-13 02:09:38
下载mysqldb首先必须下载mysqldb，下载语句是yuminstallMySQL-python安装之后，在命令行输入#>>>python#接下来是python代码>>>importMySQLdb>>>#显示出了命令行即为安装成功>&g...
标签：python 数据 linux mysql 亿万级 sql 插入
Redis 实战篇：巧用 Bitmap 实现亿级海量数据统计
时间：2022-02-18 05:15:29
本文将由二值状态统计类型作为实战篇系列的开篇，文中将用到 String、Set、Zset、List、hash 以外的拓展数据类型 Bitmap 来实现。
标签：redis 数据统计 BitMap
亿级数据表的优化问题
时间：2021-10-15 04:42:30
业务是这样的，定期要把最新的数据写到数据库里。表里有一列UpdateStatus，用来设置Archived和Current，每次在写入新数据时，把已有的数据改成Archived，然后新的数据改成Current。所以每次插入数据的步骤是，1. 先根据条件把表里对应的数据Update成Archived，...
标签：数据性能优化优化问题