四个节点分别在阿里云和华为云的服务器上,阿里云和华为云服务网络通信可能不稳定,会导致节点间的脑裂,但是脑裂后无法自动愈合,只能再次手动加入集群

环境信息

  • EMQX 版本:4.3.0
  • 操作系统及版本:linux centos
  • 其他

问题描述

四个节点分别在阿里云和华为云的服务器上,阿里云和华为云服务网络通信可能不稳定,会导致节点间的脑裂,但是脑裂后无法自动愈合,只能再次手动加入集群,请问为什么无法愈合,主要原因是什么?我看官网文档对于脑裂及自动愈合只有这一部分内容,没有找到解决办法

ERROR ** mnesia_event got {inconsistent_database, running_partitioned_network, 'emqx@**.**.**.***'}

配置文件及日志

2022-01-20T18:44:41.630738+08:00 [error] Mnesia('emqx@**.**.**.***'): ** ERROR ** mnesia_event got {inconsistent_database, running_partitioned_network, 'emqx@**.**.**.***'}
2022-01-20T18:44:41.896586+08:00 [error] Mnesia('emqx@10.73.221.27'): ** ERROR ** mnesia_event got {inconsistent_database, running_partitioned_network, 'emqx@**.**.**.***'}
2022-01-20T18:44:41.889658+08:00 [critical] [EMQ X] emqx shutdown for leave
2022-01-20T18:44:41.948121+08:00 [error] Mnesia('emqx@**.**.**.***'): ** ERROR ** mnesia_event got {inconsistent_database, running_partitioned_network, 'emqx@**.**.**.***'}
2022-01-20T18:44:42.050540+08:00 [critical] Ekka(Monitor): Network partition detected from node emqx@**.**.**.***: running_partitioned_network
2022-01-20T18:44:42.050704+08:00 [critical] Ekka(Monitor): Network partition detected from node emqx@**.**.**.***: running_partitioned_network
2022-01-20T18:44:42.050812+08:00 [critical] Ekka(Monitor): Network partition detected from node emqx@**.**.**.***: running_partitioned_network
2022-01-20T18:56:54.254164+08:00 [error] ** Node 'emqx@**.**.**.***' not responding **, ** Removing (timedout) connection **
2022-01-20T19:30:27.232129+08:00 [error] message=channel_error driver=tcp socket="#Port<0.90>" reason="etimedout" action=stopping
2022-01-20T19:30:48.736154+08:00 [error] message=channel_error driver=tcp socket="#Port<0.91>" reason="etimedout" action=stopping

你好,可以参考下这个帖子

这个帖子也没有给解决方法啊 :joy:
给出的官方文档就是我截图的那个部分


5分钟以后就不会自动愈合。