版本5.0.2.4,做个12个节点的集群。在cpu和内存都没有报警的情况下,消息出现延迟和丢失的问题。
当然是找到为什么丢弃,然后针对修复它。
一个图我也看不出任何问题:硬要找原因的话,
1.就是你这 1000 多的连接数完全没有必要搞 13 个节点。1W 以下的连接搞 1 个节点都够用了,为了高可用。分成 2 个节点也是可以的。3 个节点就显得太看不起 emqx 了。
2.而且你的操作系统负载为什么这么高。。。。
你可以看看这个视频:
- 接收器设置为 cpu 核数就行了,并不是越大越好的。大了有反作用。
- ActiveN 保持为 100 就可以。他也不会导致你的消息丢失。
Configuration Manual | EMQX 5.8.6 Docs
还是建议你找到消息丢弃的原因。对症下药