runq_overload 是哪个系统指标超负载了?

错误报告

环境

  • EMQX 版本:5.0.19
  • 操作系统版本:centos7

重现此问题的步骤

VM is overloaded on node runq_length: 410

持续时间 21 小时 56 分,从系统启动开始不断接入设备开始。一直持续

抱歉错过了你的帖子,这个告警的意思是当前系统中有 410 个进程正在等待被调度运行,你可以不用过于关注这个数字,它主要是为了指示当前 CPU 已经超出负载了。

我们会看下如何优化这个告警的提示内容。

这个是我们内部使用的vm过载标识,需要配合其他指标一起看比如内存和cpu。

如果触发时cpu异常高那很有可能CPU 算力不够来处理当前业务逻辑。如果内存也很高可能是有消息堆积。

当然也有可能CPU和内存都不高的情况那可能是IO 不够, 甚至是bug导致。

总之这个指标是erlang VM 没有足够资源处理当前业务。系统管理员需要检查系统资源利用率。

因为如今emqx可以被部署在多种环境下,EMQX 本身需要一种机制检测本身是否被平台资源所限制。

1 个赞

感谢回复。

好的