kafka原理和实践（五）spring-kafka配置详解

系列目录

一、官方配置

官方配置文档飞机票建议看Importance=medium以上的，即重要性为中级以上的，其他的用到了再说。

二、实践中的配置

properties配置如下：

bootstrap.servers=192.168.49.206:9092,192.168.49.205:9092,192.168.49.204:9092 brokers集群
acks=all 即所有副本都同步到数据时send方法才返回, 以此来完全判断数据是否发送成功, 理论上来讲数据不会丢失.
retries=10 发送失败重试次数
batch.size=1638 批处理条数：当多个记录被发送到同一个分区时，生产者会尝试将记录合并到更少的请求中。这有助于客户端和服务器的性能。
linger.ms=1 批处理延迟时间上限：即1ms过后，不管是否达到批处理数，都直接发送一次请求
buffer.memory=33554432 即32MB的批处理缓冲区

group.id=order-beta 消费者群组ID，发布-订阅模式，即如果一个生产者，多个消费者都要消费，那么需要定义自己的群组，同一群组内的消费者只有一个能消费到消息
enable.auto.commit=true 如果为true，消费者的偏移量将在后台定期提交。
auto.commit.interval.ms=1000 如何设置为自动提交（enable.auto.commit=true），这里设置自动提交周期
session.timeout.ms=15000 在使用Kafka的组管理时，用于检测消费者故障的超时
concurrency = 3 消费监听器容器并发数

1、生产者配置

具体对应第二章中xml配置：

 <bean id="producerProperties" class="java.util.HashMap">

         <constructor-arg>

             <map>

                 <entry key="bootstrap.servers" value="${bootstrap.servers}" />

                 <entry key="retries" value="${retries}" />

                 <entry key="batch.size" value="${batch.size}" />

                 <entry key="linger.ms" value="${linger.ms}" />

                 <entry key="buffer.memory" value="${buffer.memory}" />

                 <entry key="acks" value="${acks}" />

                 <entry key="key.serializer" value="org.apache.kafka.common.serialization.StringSerializer" />源码预制的UTF8字符串反序列化实现类  byte[]-》String

                 <entry key="value.serializer" value="org.apache.kafka.common.serialization.StringSerializer" />

             </map>

         </constructor-arg>

     </bean>

2、消费者配置

具体对应第二章中xml配置：

 <!-- 定义consumer的参数 -->

     <bean id="consumerProperties" class="java.util.HashMap">

         <constructor-arg>

             <map>

                 <entry key="bootstrap.servers" value="${bootstrap.servers}" />

                 <entry key="group.id" value="${group.id}" />

                 <entry key="enable.auto.commit" value="${enable.auto.commit}" />

                 <entry key="session.timeout.ms" value="${session.timeout.ms}" />

                 <entry key="key.deserializer"

                     value="org.apache.kafka.common.serialization.StringDeserializer" />

                 <entry key="value.deserializer"

                     value="org.apache.kafka.common.serialization.StringDeserializer" />

             </map>

         </constructor-arg>

     </bean>

 <bean id="messageListenerContainer" class="org.springframework.kafka.listener.ConcurrentMessageListenerContainer" init-method="doStart" >

         <constructor-arg ref="consumerFactory" />

         <property name="concurrency" value="${concurrency}" />消费监听器容器并发数

5 </bean>

3. 使用规范

这里发布一个真实的公司要求的使用规范，当然比较简单哈，但贵在真实：

a: Producer 部分参数设定:

　　1: acks 设置为 "all" 即所有副本都同步到数据时send方法才返回, 以此来完全判断数据是否发送成功, 理论上来讲数据不会丢失.

　　　　2: retries = MAX 无限重试，直到你意识到出现了问题.

　　　　3: 使用 callback 来处理消息失败发送逻辑.

　　　　4: min.insync.replicas > 1 消息至少要被写入到这么多副本才算成功，也是提升数据持久性的一个参数。与acks配合使用.

　　　　5: 其他一些超时参数: reconnect.backoff.ms, retry.backoff.ms , linger.ms 结合 batch.size 等.

b: Consumer 部分参数设定:

1: auto.offset.reset 设置为 "earliest" 避免 offset 丢失时跳过未消费的消息. 目前消息存储不统一, 部分使用 zookeeper, 部分使用 kafka topic.

2: enable.auto.commit=false 关闭自动提交位移, 在消息被完整处理之后再手动提交位移.

3: consumer 的并发受 partition 的限制. 如果消息处理量比较大的情况请提前与运维联系, 增加 partition 数量应对消费端并发. 默认topic partition 为6-8个.

partition 也不是越多越好. 首先会增加 file 和 memory, 其次会延长选举时间, 并且会延长 offset 的查询时间. partition可以扩容但无法缩减.

极限情况的数据丢失现象.

a: 即使将 ack 设置为 "all" 也会在一定情况下丢失消息. 因为 kafka 的高性能特性, 消息在写入 kafka 时并没有落盘而是写入了 OS buffer 中. 使用 OS 的脏页刷新策略周期性落盘, 就算落盘仍然会有 raid buffer. 前者机器宕机数据丢失, 后者机器跳电数据丢失.

b: 对数据可靠性较高的场景建议 offset 手动提交. 自动提交当遇到业务系统上线被关闭时, 消息读取并且 offset 已经提交, 但是数据没有存储或者仍没来得及消费时, 消息状态在内存中无法保留, 重启应用会跳过消息致使消息丢失.

kafka原理和实践（五）spring-kafka配置详解的更多相关文章

spring事务配置详解
一.前言好几天没有在对spring进行学习了,由于这几天在赶项目,没有什么时间闲下来继续学习,导致spring核心架构详解没有继续下去,在接下来的时间里面,会继续对spring的核心架构在继续进行学 ...
spring MVC配置详解
现在主流的Web MVC框架除了Struts这个主力外,其次就是Spring MVC了,因此这也是作为一名程序员需要掌握的主流框架,框架选择多了,应对多变的需求和业务时,可实行的方案自然就多了.不过 ...
Spring mvc 配置详解
现在主流的Web MVC框架除了Struts这个主力外,其次就是Spring MVC了,因此这也是作为一名程序员需要掌握的主流框架,框架选择多了,应对多变的需求和业务时,可实行的方案自然就多了.不过 ...
spring MVC配置详解（转）
现在主流的Web MVC框架除了Struts这个主力外,其次就是Spring MVC了,因此这也是作为一名程序员需要掌握的主流框架,框架选择多了,应对多变的需求和业务时,可实行的方案自然就多了.不过 ...
Spring MVC配置详解（3）
一.Spring MVC环境搭建:(Spring 2.5.6 + Hibernate 3.2.0) 1. jar包引入 Spring 2.5.6:spring.jar.spring-webmvc.ja ...
Spring学习(十九)----- Spring的五种事务配置详解
前段时间对Spring的事务配置做了比较深入的研究,在此之间对Spring的事务配置虽说也配置过,但是一直没有一个清楚的认识.通过这次的学习发觉Spring的事务配置只要把思路理清,还是比较好掌握的. ...
笔记：Spring Boot 配置详解
Spring Boot 针对常用的开发场景提供了一系列自动化配置来减少原本复杂而又几乎很少改动的模板配置内容,但是,我们还是需要了解如何在Spring Boot中修改这些自动化的配置,以应对一些特殊场 ...
Spring Boot 配置详解
Spring Boot 针对常用的开发场景提供了一系列自动化配置来减少原本复杂而又几乎很少改动的模板配置内容,但是,我们还是需要了解如何在Spring Boot中修改这些自动化的配置,以应对一些特殊场 ...
Spring 的配置详解
Bean元素 Spring创建对象的方式 (1)空参构造方式 (2)静态工厂(了解) (3)实例工厂方式 Bean元素进阶 (1)scope属性 a.singleton (2)生命周期属性 Sprin ...

随机推荐

SignalR
https://msdn.microsoft.com/zh-cn/magazine/dn802609.aspx http://www.asp.net/signalr/overview/getting- ...
Oracle通过一个Value值查询数据库
---恢复内容开始--- 大家在想看看数据库中有哪些数据表中,哪些字段中有“helloworld” 这个字符串,现在数据库所有的表,视图都不能直接提供,所有必须通过循环去访问所有的数据表,所有的字段列 ...
Java集合框架（常用类） JCF
Java集合框架(常用类) JCF 为了实现某一目的或功能而预先设计好一系列封装好的具有继承关系或实现关系类的接口: 集合的由来: 特点:元素类型可以不同,集合长度可变,空间不固定: 管理集合类和接口 ...
hdu 3172
http://acm.hdu.edu.cn/showproblem.php?pid=3172 题意:输出每对朋友的关系网大小并查集的时候维护一个数组记录根节点的大小即可,水题,这题坑在T组数据这个也 ...
802&period;11 wireless 三
802.11 wireless 3watts,milliwatts,and Decibels瓦特(功率单位)的定义是1焦耳/秒微波炉1000瓦特,手机100-200毫瓦 decibels(分贝:比较能 ...
Java 开源博客 —— Solo 0&period;6&period;9 发布时间！
Solo 它是 GitHub 上 Star 的最大数量 Java 博客系统,今天,我们宣布 0.6.9 正式版,欢迎来到下载. 特性基于标签的文章分类博客/标签 Atom/RSS.Sitemap ...
Maven下从HDFS文件系统读取文件内容
需要注意以下几点 1.所以的包都是org.apache.hadoop.XXX 2.三个配置文件要放到指定文件夹中等待文件系统读取(src/main/resources):core-site.xml h ...
camera理论基础和工作原理（转）
源: camera理论基础和工作原理
loj2538 「PKUWC2018」Slay the Spire 【dp】
题目链接 loj2538 题解比较明显的是,由于强化牌倍数大于\(1\),肯定是能用强化牌尽量用强化牌如果强化牌大于等于\(k\),就留一个位给攻击牌所以我们将两种牌分别排序,企图计算\(F(i ...
借助AWR报告分析解决oracleCPU过高的问题（转）
原文地址:http://www.cnblogs.com/crystal-guoguo/p/4213458.html 简介:在oracle数据库中,有两个非常实用的自带监控工具EM(Enterprise ...