Kafka的消息可靠传递

18 November, 2017

Kafka的消息可靠传递

笔记

Kafka提供的基础保障可以用来构建可靠的系统, 却无法保证完全可靠. 需要在可靠性和吞吐之间做取舍.

Kafka在分区上提供了消息的顺序保证.
生产的消息在写入到所有的同步分区上后被认为是已提交 (不需要刷到硬盘). 生产者可以选择在消息提交完成后接收broker的确认, 是写入leader之后, 或者所有的副本
只要有一个副本存在, 提交的消息就不会丢失
消费者只能读取到已提交的消息

复制

Kafka的复制机制保证每个分区有多个副本, 每个副本可以作为leader或者follower的角色存在. 为了保证副本的同步, 需要做到:

保持到zk的连接会话: 每隔6s向zk发送心跳, 时间可配置
每隔10s向leader拉取消息, 时间可配置
从leader拉取最近10s的写入的消息. 保持不间断的从leader获取消息是不够的, 必须保证几乎没有延迟

Broker配置

复制因子

default.replication.factor broker级别的副本数设置, 通过这个配置来控制自动创建的topic的副本数. 为N的时候, 可以容忍失去N-1个副本, 保证topic的可读写.

unclean.leader.election.enable 0.11.0.0之前的版本, 默认为true; 之后的版本默认为false. 这个设置控制不同步的副本能否参与leader的选举. 如果设置为true, 当没有同步副本可用的时候, 不同步的副本会成为leader, 意味着有数据丢失. 如果设置为false, 则意味着系统会处于不可用的状态, 该部分没有leader提供服务. 需要在可用性和一致性之间做取舍.

最小同步副本数

min.insync.replicas 这个设置可以作用于broker和topic级别. 假如broker数为3, 最小同步副本数为2. 当2个同步副本中的一个出现问题, 集群便不会再接受生产者的发送消息请求. 同事客户端会收到NotEnoughReplicasException. 此时, 消费者还可以继续读取存在的数据. 唯一的同步副本变成只读.

可靠系统中使用生产者

发送确认

acks 可选0, 1或者all. 设置影响吞吐和一致性.

acks=0 意味着消息发送出去后就认为是成功写入topic.
acks=1 发送后等待leader写入后确认
acks=all 发送后等待所有副本写入后确认

重试

retries 消息发送后会收到成功或者错误码. 错误有两种, 可重试的和不可重试的. 对于可重试的错误, 生产者会重复发送, 而reties控制重试的次数. 比如borker返回LEADER_NOT_AVAILABLE错误, 生产者会自动进行重试(retries不等于0), 因为broker之后会选择新的leader. 如果返回INVALID_CONFIG, 重试也不会解决问题. 同时retries有可能导致消息重复, 这就是Kafka消息的at least once保证. 在0.11.0.0之后, 提供了幂等的特性, 保证消息的exactly one. 对于跨数据中心的复制(比如MirrorMaker), 默认设置为Integer.MAX_VALUE

额外的错误处理

使用生产者内置的重试是一个正确处理多种错误而不丢失消息的简单途径. 但是开发者还需要处理其他的错误, 比如:

不可重试错误
发送之前的错误
场试完所有的重试次数后还是未成功发送.

可靠系统中使用消费者

已提交消息和已提交偏移量 完全不同的两个概念, 前者是对生产者有效, 后者是对消费者有效.

重要设置

group.id 两个有相同group.id并且订阅同一个topic的消费者, 会分配到topic下分区的一个子集, 并且是独立的子集.
auto.offset.reset 这个参数控制当broker端没有发现任何提交的偏移量的时候, 消费者应该从什么位置开始读取消息. 接受earliest和latest两种设置. earliest意思是会从0开始读取, 而latest意思是从最末尾开始.
enable.auto.commit 按照时间计划提交偏移量或者代码中手动提交. 对consumer来说这是一个重大的决定. 自动提交会保证只提交循环中已经处理的数据, 但是有可能会在下次提交始前系统崩溃. 这就导致已经被处理的消息的偏移量没有提交到broker. 下次拉取的时候(consumer重新上线或者rebalance时候由其他消费者处理该分区)会重新拉取已经处理过的消息, 重复消费. 假如你是将拉取的消息交由其他的线程处理, 那自动提交可能会到时消息被拉取, 却没有被处理. 自动提交的好处是吞吐量大.
auto.commit.interval.ms 当enable.auto.commit设置为true的时候, 通过这个配置控制自动提交的时间间隔. 越大吞吐就越大, 一致性就越低. 越小, 则会增加提交的次数, 影响吞吐, 但是会提高一致性.

Kafka的消息可靠传递

复制

Broker配置

复制因子

脏副本的leader选举

最小同步副本数

可靠系统中使用生产者

发送确认

重试

额外的错误处理

可靠系统中使用消费者

重要设置

准确提交偏移量

总是提交已经处理过得消息

提交频率是性能和系统崩溃时重复的消息数量间的取舍

保证你清楚的了解将要提交什么偏移量

再平衡

消费者可能需要重试

消费者可能需要维护状态

处理长时间的处理

有且只有一次的消息投递

目录

推荐阅读

Kafka发送不同确认方式的性能差异

Kafka消息消费一致性

Kafka 恰好一次发送和事务消费示例