版本:5.7.1
现象:客户反馈现场机器的物联设备全部离线,重启机器后恢复,查看EMQX的日志看到日志缺失(如图从6点-8点无任何日志),应该如何排查问题
可能是 emqx 被系统杀掉了,看一下系统日志 /var/log/messages,检查里面是不是有 oom。
现在同事离开现场了暂时看不到日志,从昨天的日志看现场有一些消息丢弃的告警。现场的机器内存配置为32G,另外请教一下这个版本内EMQX的内存配置是怎样的
如果你不是设备数量非常大,32GB 肯定够用了,但在某些情况下仍然可能出现问题,你需要实时监控 emqx 的内存使用率,在使用率较高时及时调查问题。
明白。另外有些奇怪的是,我们是将emqx注册成服务的,重启策略为Restart=on-failure,这个策略是不会生效吗
现场目前也就10个链接左右
设置为 no-failure 应该没有问题,你可以找个机器测试一下,直接 kill -9 <emqx的PID>,看看能不能重启。
那有些奇怪,不应该有2h的日志空白才对