EMQX集群节点不停的尝试与自己进行连接

环境

  • EMQX 版本:5.7.0开源版
  • 操作系统版本:Kylin v10

我部署了一个包含6个节点的EMQX集群,6个节点分布在2个机房中,每个机房有3个节点。最近查看日志的时候,发现每个节点都在不停的报错误日志,根据日志显示节点在与某个节点peer进行连接时报认证超时、连接失败等操作,奇怪的是每个节点尝试连接的peer都是自己的IP地址,请问为什么会发送这种情况?

我的集群配置信息如下:
export EMQX_NODE__NAME=emqx@ip1
export EMQX_NODE__COOKIE=emqxsecretcookie-cluster1
export EMQX_CLUSTER__NAME=emqx-cluster1
export EMQX_CLUSTER__STATIC__SEEDS=[emqx@ip1,emqx@ip2,emqx@ip3,emqx@ip4,emqx@ip5,emqx@ip6]

错误日志如下:
[info] even=client_connection_received driver=tcp socket=“#Port<0.5>” action=starting_acceptor
[info] even=start driver=tcp peer=“192.168.1.85:19676”
[error] msg: gen_rpc_client_auth_timeout, error: closed, peer: {{192,168,1,85},19676}
[error] State machine {acceptor,{{192,168,1,85},19676}} terminating Reason: {badtcp,closed}. Stack: [{gen_statem,loop_state_callback_result,11,[{file,“gen_statem.erl”},{line,1524}]},{proc_lib,init_p_do_apply,3,[{file,“proc_lib.erl”},{line,241}]}]. Last even: {{call,{<0.2279.0>,#Ref<0.2998193559.4150001666.173067>}},{socket_ready,#Port<0.333744>}}. State: {waiting_for_socket,{state,#Port<0.333744>,tcp,gen_rpc_driver_tcp,tcp_closed,tcp_error,{{192,168,1,85},19676},disabled,disable}}. Client gen_rpc_server_tcp stacktrace: [{gen,do_call,4,[{file,“gen.erl”},{line,240}]},{gen_statem,call,3,[{file,“gen_statem.erl”},{line,923}]},{gen_rpc_server,waiting_for_connection,3,[{file,“gen_rpc_server.erl”},{line,81}]},{gen_statem,loop_state_callback,11,[{file,“gen_statem.erl”},{line,1395}]}]
[error] crasher: initial call: gen_rpc_acceptor:init/1, pid: <0.1431358.0>, registered_name:, exit: {{badtcp,closed},[{gen_statem,loop_state_callback_result,11,[{file,“gen_statem.erl”},{line,1524}]},{proc_lib,init_p_do_apply,3,[{file,“proc_lib.erl”},{line,241}]}]}, ancestors: [gen_rpc_acceptor_sup,gen_rpc_sup,<0.2276.0>], message_queue_len: 0, messages: , links: [<0.2280.0>], dictionary: , trap_exit: true, status: running, heap_size: 6772, stack_size: 28, reductions: 12123; neighbours:
[error] Supervisor: {local,gen_rpc_acceptor_sup}. Context: child_terminated. Reason: {badtcp,closed}. Offender: id=gen_rpc_acceptor,pid=<0.1431358.0>
[info] msg: terminate, peername: 29.30.193.85:59394, reason: {shutdown,tcp_closed}

如果这个是自己的IP的话,的确有点奇怪,麻烦在GitHub 提个issue 详细说一下怎么复现的

对了 这个seed的里面不要写自己的IP 试试

目前我这边也无法复现,从日志上看是突然就报出这个错误,我的日志级别设置为info,因此没有看到更多的信息