EMQ集群5.1.2运行一段时间后重启报错

环境

  • EMQX 版本:5.1.2
  • 操作系统版本:centos 7

重现此问题的步骤

集群是由3主节点+2从节点组成,由5.1.0版本升级而来,集群升级正常,运行一段时间后,将一个主节点关闭,一段时间后在dashboard中也无法看到该节点,今天测试完规则引擎后,发现没连接时内存占用也较高,由30%样子,想重启下节点,关掉后此时节点不能正常启动,报错如下:



10.187.129.150是运行一段时间后主动停掉的主节点

log.zip (4.8 KB)

我先确定下这个步骤,看理解是否正确:

  1. v5.1.2 版本的 3 Core + 2 Replicant 节点运行了一段时间。
  2. 将其中一个 Core 节点关闭
  3. 过了一天(或者几天后)重新启动该 Core 节点,发现该节点无法正确启动
  4. 并报告 log.zip 这个附件中的日志。

方便分享下,你是如何配置这3+2个节点的集群方式么?

集群是静态配置的,

  1. v5.1.2 版本的 3 Core + 2 Replicant 节点运行了一段时间。
  2. 将其中一个 Core 节点关闭
    3.过了一天(或者几天后)对其中另外两个主节点进行压测,重新启动另外两个主节点,这两个主节点关掉后无法启动,启动之前关掉的core节点也无法启动。
    4.log.zip是其中一台主节点的
    尝试解决:
    1.删除主节点data目录中mnesia文件夹再次启动,启动失败
    2.删除data中cluster.hocon配置后,启动主节点,启动成功