1.第三个节点3月29日故障离线过,当时emqx只有两个节点在线,但是iot设备连接正常。后续3号节点重新上线,连接好像就自动平衡了。从那以后好像1-2节点内存上升就快了。
2.我们emqx现在大概有4000万保留消息,管理界面已经打不开保留消息界面,当时上线时没有设置定期清理。是否是保留消息导致的。
# emqx ctl retainer info
Number of retained messages: 45071428
3.从管理界面来看,那个14:29左右有个消息流入高峰,那个时候我点了一下管理界面的保留消息界面,好像emqx就提示网络错误就卡一下,结果就有了一个消息流入和消息丢失的高峰。
4.通过监控查看时3月29日节点故障重连以后内存增长好像就快了。