CLUSTER COUNT-FAILURE-REPORTS

用法
CLUSTER COUNT-FAILURE-REPORTS 节点ID
复杂度
O(N),其中 N 是故障报告的数量
始于
3.0.0
ACL 类别
@admin, @dangerous, @slow

该命令返回指定节点的故障报告数量。故障报告是 Valkey 集群用于将 PFAIL 状态(即节点不可达)提升为 FAIL 状态的方式。FAIL 状态表示集群中大多数主节点在一定时间内均确认该节点不可达。

更多详情

  • 当一个节点在超过配置的节点超时时间后仍不可达时,该节点会将另一个节点标记为 PFAIL节点超时是 Valkey 集群的一个基本配置参数。
  • 处于 PFAIL 状态的节点会在心跳包的 gossip 部分中提供。
  • 每当一个节点处理来自其他节点的 gossip 包时,它会创建(并在需要时刷新 TTL)故障报告,记录某个给定节点表示另一个给定节点处于 PFAIL 状态。
  • 每个故障报告的生存时间是节点超时时间的两倍。
  • 如果在给定时间,一个节点将另一个节点标记为 PFAIL,并且同时收集到了大多数其他主节点关于该节点的故障报告(如果自身是主节点也包括自身),那么它会将该节点的故障状态从 PFAIL 提升到 FAIL,并广播一条消息,强制所有可达节点将该节点标记为 FAIL

此命令返回当前节点尚未过期的故障报告数量(即在节点超时时间两倍内收到的)。此计数不包括我们查询的节点自身对作为参数传递的节点ID的判断,此计数包括该节点从其他节点收到的故障报告。

当 Valkey 集群的故障检测器未能按预期工作时,此命令主要用于调试。

RESP2/RESP3 回复

整数回复:节点的活动故障报告数量。