emqx-5.3.1 大量接入设备之后,集群运行一小时左右就挂掉


看日志是当前节点到其他节点的连接被拒绝了
reason=econnrefused
目前信息不足
可能的排查方向主要有这几个

  • 你的集群部署方式是什么,emqx 的节点/集群配置项可以再 double check 一下,或者贴在帖子里来看看
  • 集群网络环境和节点间连通性如何?
  • 检查所有节点的日志,按照日志时间,最先出现问题的节点是哪个,在那个时间段出做了什么操作,机器压力大不大?定位下最初出现问题的时间点和 warning/error 日志信息