使用默认配置,手动加入集群后,集群中其中一台设备掉线,其他两台设备需要等1分钟左右才能重新连接

版本:5.1.6
怎样把这1分钟左右的时间缩短?比如缩短为2s

“其中一台设备掉线,其他两台设备需要等1分钟左右才能连接”

能详细描述一下这里的场景/环境/操作/现象么,例如:

  • 目前环境是几个节点集群,节点角色分别是什么?
  • 部署方式是什么
  • 手动加入集群 step-by-step 的操作过程
  • 加入集群前后各个节点的日志

1、目前环境中有3个节点,节点名称分别是emqx287454054@192.168.3.22,emqx287454020@192.168.3.21,emqx287454037@192.168.3.20。角色不太明白是什么意思
2、集群方式是手动集群
3、三台设备都启动,都执行./bin/emqx start;然后emqx287454054@192.168.3.22,emqx287454020@192.168.3.21执行./bin/emqx_ctl cluster join emqx287454037@192.168.3.20;然后把其中一台设备的网线拔掉。使用mqttx连接其他两台设备,连接不上
4、使用./bin/emqx_ctl cluster status,回复的集群信息中有三台设备集群成功的信息

目前遇到了另一个问题:三台设备集群成功后,没有stop。直接断电。然后重新启动时,只有三台设备几乎同时启动,才能启动成功。否则先启动的设备一直都在等待。
emqx调试.zip (6.6 KB)
这是其中一台的日志文件

目前用三台 docker 容器没有复现出来你遇到的问题

你的两台正在运行 emqx 的机器上执行 ./bin/emqx_ctl cluster status 详细的输出是什么
应该会报告被拔网线的那台 emqx 在 stopped_nodes 列表里

@zwg0829 请问三个节点都是core节点吗?

不知道什么是core节点。我这边三个节点都有自己的服务器,服务器间通过手动集群加入的。配置没有改过。

问一下:你们是不是测试的时候会执行stop指令?我断电重启前没有执行stop指令,因为我不知道客户什么时候停止。拔掉以后刚开始没有在stopped_nodes里面,经过大概2分钟才能到stopped_nodes里面

配置没改的话就是core节点

三个都是core节点,有什么问题吗?