连接丢失

环境信息

  • EMQX 版本:4.2.14
  • 操作系统及版本:cenos7.9
  • 其他 鉴权用的是http auth插件acl

问题描述

第一个问题:
emq客户端(生产者和消费者)再跑一段时间后发现emqx日志有连接丢失的情况:
2022-03-01 13:39:57.574 [error] <<“adapter_a33bd7b24321bc429f0dad422aff859e”>>@192.168.10.11:34218 [ACL http] Request ACL path /mqtt/acl, error: {closed,
“The connection was lost.”}
很多如上的日志(这个是消费端观察 Dashboard客户端并没有重连)

生产端也会存在类似问题:emqx日志:
2022-03-01 13:23:07.908 [error] <<“thing-3IGIDU61”>>@192.168.10.11:20388 [ACL http] Request ACL path /mqtt/acl, error: {closed,
“The connection was lost.”}
生产端有时候会掉线,然后可能重启软件才能连接上,不知道是不是上面的问题;

第二个问题:
emqx很多这样的日志是不是有问题:
2022-03-01 13:23:11.035 [warning] Received gun_down with closed
2022-03-01 13:23:11.038 [warning] Received gun_down with closed
2022-03-01 13:23:11.091 [warning] <<“thing-I7XVQ00R”>>@192.168.10.11:20375 [Channel] The PUBREC PacketId 3460 is inuse.
2022-03-01 13:23:11.092 [warning] <<“thing-I7XVQ00R”>>@192.168.10.11:20375 [Channel] The PUBCOMP PacketId 3460 is not found
2022-03-01 13:23:11.302 [warning] <<“thing-I7XVQ00R”>>@192.168.10.11:20375 [Channel] The PUBREC PacketId 3461 is inuse.
2022-03-01 13:23:11.302 [warning] <<“thing-I7XVQ00R”>>@192.168.10.11:20375 [Channel] The PUBCOMP PacketId 3461 is not found
2022-03-01 13:23:11.372 [warning] <<“thing-82487L89”>>@192.168.10.11:17092 [Channel] The PUBREC PacketId 513 is inuse.
2022-03-01 13:23:11.412 [warning] <<“thing-82487L89”>>@192.168.10.11:17092 [Channel] The PUBCOMP PacketId 513 is not found
2022-03-01 13:23:11.424 [warning] <<“thing-498RNXWV”>>@192.168.10.11:4700 [Channel] The PUBREC PacketId 1076 is inuse.
2022-03-01 13:23:11.425 [warning] <<“thing-498RNXWV”>>@192.168.10.11:4700 [Channel] The PUBCOMP PacketId 1076 is not found
2022-03-01 13:23:11.515 [warning] <<“thing-82487L89”>>@192.168.10.11:17092 [Channel] The PUBREC PacketId 514 is inuse.
2022-03-01 13:23:11.542 [warning] Received gun_down with closed

配置文件及日志

这里看起来是,我们的 http 客户端库,去请求的时候 Socket 关掉了。
是不会影响你的 MQTT 连接的,但是这次的 ACL 请求 或者 AUTH 认证请求会失败。

如果可以的话,能看看最新版本 4.3.12 上面还有这个问题吗?

部分设备(生产端)过一段时间会掉线,然后一直重连不上,重启后能连接上,,,emq4.2.14确定存在这个问题吗?因为一直排查不到哪里的问题,还在排查连接的客户端,,排查不到问题。。。

看emqx日志除了上面的也看不出哪里问题,,也没有类似busy(消费能力不足)的报错

这里的重启是指重启了设备,还是重启了EMQX?
PS:不过我们目前已经不推荐使用4.2.X版本了,4.2.X已经到了版本末期,即将超过维护周期,推荐使用4.4.1版本。

重启设备技能连接上,,不然 设备一直是重连。。。本来以为网络问题 发现重启设备技能连接上

可能是设备重连的策略导致的,可以使用追踪功能看下这个设备的工作状态,参考这个文档

本地测试 就复现不出来 奇了怪了 都能重连上。。。