开源版5.5.0、5.0.4版本发生消息延迟

基础情况:春节期间出现消息延迟,延迟时间大部分1分钟,小部分达到1-2分钟。mqtt终端数3k,消息流入、流出高峰各300条/秒左右。使用emqx stop、emqx start后恢复,log日志(/var/log/emqx/)在重启后已丢失。一般都是隔天出现延迟问题。请问如何排查?

还是需要日志才能知道当时发生了什么。你也可以创建一个跟生产环境一样的环境,配置、各种数据集成、插件、认证等跟生产都一样,然后模拟一个大流量去压测。

如果延迟是发生在 emqx 内部,问题一般是鉴权(authz) 或者某些数据集成(比如 mysql)功能导致的。

这些都需要查看/var/log/emqx目录下的日志是吧?

是的,如果里面有鉴权等模块的超时日志,那么可以帮助定位问题。

但搭建一个测试环境然后做压力测试模拟真实场景去复现问题是最好的办法,可以实时看到 emqx 发生了什么,调查并找到系统瓶颈。