React 前端导航

Doris be 日志大量警告:/brpc/src/brpc/socket.cpp:1196] Fail to wait EPOLLOUT of fd=187: Connection timed out

Doris be 日志大量警告:/brpc/src/brpc/socket.cpp:1196] Fail to wait EPOLLOUT of fd=187: Connection timed out

背景

测试环境:1台 fe(2核8G) + 3 台be(2核8G),采用 stream load 方式导入数据,运行一段时间后,大量出现 Fail to wait EPOLLOUT of fd=187: Connection timed out [110] 的日志。

日志如下:

W0102 04:50:16.640652  4216 socket.cpp:1194] Fail to wait EPOLLOUT of fd=365: Connection timed out [110]
W0102 04:50:17.641734  4216 socket.cpp:1194] Fail to wait EPOLLOUT of fd=365: Connection timed out [110]
W0102 04:50:18.141074  4216 socket.cpp:1194] Fail to wait EPOLLOUT of fd=452: Connection timed out [110]
W0102 04:50:20.141149  4216 socket.cpp:1194] Fail to wait EPOLLOUT of fd=313: Connection timed out [110]
W0102 04:50:21.142115  4212 socket.cpp:1194] Fail to wait EPOLLOUT of fd=326: Connection timed out [110]

Doris 状态

导入数据量也不大,每次最多导入1000条数据,内存磁盘都正常,be大概还剩 1.5G 左右内存,磁盘 50G 的基本没消耗。

如何解决

暂时没找到原因,目前看并没有导致 be 挂掉。

网上找解决办法也没有找到,只有一个未解决的 issue

1.对端启动了吗?
2.能提供下最小复现的代码吗,可能不是对端没有启动的原因
3.场景就是:client --- server --- backupend
如果client侧的timeout_ms比server到backupend的timeout_ms小的时候。
client超时,断开连接,server感知不到,导致链接处于CLOSE_WAIT,当超过了系统连接限制就进入假死状态。
4.--usercode_in_pthread=true
去掉这个,CLOSE_WAIT很快就释放了,如果存在这个配置,CLOSE_WAIT会一直存在。
6.如果client遇到超时关闭连接,但是server端还卡在和backupend通信中,并未结束请求,这时候CLOSE_WAIT是符合预期的

知道问题原因或者解决办法的小伙伴请 留言 告诉我们,谢谢!

声明:本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。邮箱:farmerlzj@163.com。 本站原创内容未经允许不得转载,或转载时需注明出处: 内容转载自: React前端网:https://qianduan.shop/blogs/detail/34
想做或者在做副业的朋友欢迎加微信交流:farmerlzj,公众号:生财空间站。

#doris#aws#EC2

相关推荐

AWS EC2 扩展 EBS 文件系统

AWS EC2 磁盘空间不够用,常常被日志占满导致服务中断,此文记录 EC2 扩展 EBS 文件系统的操作步骤。

Doris 部署,启动 FE 报错:

错误提示:java.io.IOException: the self host 172.31.26.7 does not equal to the host in ROLE file 172.17.0.1. You need to set “priority_networks” config in fe.conf to match the host 172.17.0.1