选举安全原则 Election Safety: 一个任期内最多只有一个领导人当选
领导人只增加原则 Leader Append-Only: 领导人永远不会覆盖或者删除自己的日志, 它只会增加条目
日志匹配原则 Log Matching: 如果两个日志在相同的索引位置上的日志条目的任期号相同, 那么我们就认为日志从头到这个索引位置之间的条目完全相同
领导人完全原则 Leader Completeness: 如果一个日志条目在一个给定任期内被提交, 那么这个条目一定会出现在所有任期号更大的领导人中
状态机安全原则 State Machine Safety: 如果一个服务器已经将给定索引位置的日志条目应用到状态机中, 则所有的其他服务器不会在该索引位置应用不同的条目

领导人选举 (Leader election)

集群成员的状态

领导人
候选人
追随者.

状态转换

在同一时间, 成员只会属于其中的一种状态. 并且集群中只会存在一个领导人.

有领导人时: 一个领导人, n-1个追随者无领导人时: x个候选人, n-x个追随者

约束

集群中最多存在一个领导人
追随者不会发送请求, 只会接受来自领导人的AppendEntries RPC请求, 和候选人的RequestVote RPC请求. AppendEntries RPC请求同时提供heartbeat机制
领导人只接受来自客户端的请求

任期

时间流

时间被划分为一个个的任期, 每一个任期的开始都是领导人的选举.

随机的选举超时时间例如150~300毫秒, 防止无限选举失败.

日志复制

约束

日志的流向只会是从领导人到追随者. 领导人不会覆盖自己的日志.

流程

领导人接受来自客户端的请求, 把请求中的命令作为日志条目加入到自己的日志中, 然后向追随者发送AppendEnties RPC请求, 要求追随者复制这条日志条目. 追随者复制完成后会响应领导人. 所有的请求都会响应后, 领导人会将该条目应用到状态机中, 并响应客户端. 假如有追随者没有响应, 领导人会无限地重试AppendEnties RPC请求直到所有的追随者都复制了该条目.

安全性

没有包含全部日志的服务器不会赢得选举, 即某些投票请求的响应返回false.

日志压缩

把当前的系统状态写入快照(snapshot)中, 并持久化到存储中, 然后丢弃之前的全部日志.

保存条目1-5到快照中

快照中包含了最后的索引值和任期号.

增量压缩(incremental approaches)

领导人必须偶尔地发送快照给一些落后的跟随者. 运行非常缓慢或者新加入的跟随者不能与领导人保持同步, 可以通过发送快照的方式让跟随者更新到最新的状态.

参考

Raft 一致性算法论文译文

Raft算法学习

Raft

名词

复制状态机

任期号 (currentTerm)

投票的候选人id (votedFor)

已被提交的最大日志条目的索引值 (commitIndex)

被状态机执行的最⼤日志条⽬的索引值 (lastApplied)

请求

日志复制请求 (AppendEntries RPC)

发起投票请求 (RequestVote RPC)

安装快照请求 (InstalSnapshotRPC)

约束/原则

领导人选举 (Leader election)

集群成员的状态

约束

任期

日志复制

约束

流程

安全性

日志压缩

参考

目录

推荐阅读