emqx4.3.5版本,集群重启之后 有大概率随机使一条规则引擎里的规则失效

环境信息

  • EMQX 版本:4.3.5
  • 操作系统及版本:centOS7
  • 其他

集群重启之后 有大概率随机使一条规则引擎里的规则失效
重启前


emqx集群进行重启
image
重启之后有概率随机使一条消息失效

1.请问如何解决,2.请问规则引擎存储在emqx服务器里的哪个地方

这条规则配置的动作,使用的资源状态是可用的吗。
EMQX 在初始化规则引擎和规则的动作时,需要初始化 action 使用的资源,如果 action 初始化失败(包括但不限于资源不可用等情况)会将这一条规则关闭。

是可用的 而且经过实验,
1.集群或者单点重启都有概率会使规则失效
2.因为重启导致的规则失效,会在emqx集群或者单点再次重启的时候恢复,但同时也会有概率触发1
3.如果是人为在web界面关闭规则,则重启集群或者单点无法恢复此规则

可以提供下更详细的配置信息,以及启动时规则初始化相关的日志来方便排查下么?

1.请问初始化的日志放在哪里 是这个 /var/log/emqx/emqx.log.1?
2.更详细的配置
使用$events/client_disconnected $events/client_connected 这两条规则,也会出现失效的问题,响应动作使用的资源是web_hook,web_hook使用的请求 URL确认是可用的

日志是循环写的,按照距离重启时间最近的那个看,日志里面也会打具体的时间。
资源可用情况可以看一下 Resource 页面

出现规则失效后的日志 这是集群中一台服务器中出现的日志,其他两台都是正常的



image
大佬 帮忙分析一下呗

看了下 v4.3.5 的代码,在之后的版本中已经修复,可以升级到最新的 v4.3.18 尝试一下?

也就是说 这个是系统BUG吗? 有没有什么补救的措施 :smiling_face_with_tear:

可以热升级试一下,见文档
Relup

好的