先说明一下问题:
最近系统上线,系统使用HttpClient发送报文(会有循环发送情况)到外部系统通过nginx分发,这时nginx会报出connect failed (110- Connection timed out)错误(有一些请求报错,有一些不报,都是不定的),在网络中查到的答案大部分都说是因为系统内核错误,因为Nginx调用了gettimeofday()方法,但是我们通过编写C代码调用gettimeofday()方法进行测试,根本无法重现这个BUG,所以想到会不会是因为系统内部的错误。
经过调查发现我们在使用HttpClient发送报文之后没有关闭连接,添加代码:
httpclient = new DefaultHttpClient(new ThreadSafeClientConnManager());
finally { if (httpclient != null && httppost != null){ // 释放连接资源 httppost.releaseConnection(); // 关闭Socket连接 httpclient.getConnectionManager().shutdown(); } }
然后再经过一天一夜的测试发现没有再出现connect failed (110- Connection timed out)这个问题了。
再说一下出现这个问题的猜测:
系统内部(我们系统有定时器和主动发送)一直再创建新的httpclient连接并且没有关闭这个连接,一旦出现大量发送报文会导致系统与Nginx之间的等待的连接过多,这样会导致nginx分发出现问题,从而导致nginx报出Connection timed out,因为连接太多了,没有释放,而nginx主动释放连接是有时间的。
这是我的猜测,能帮到你最好,如果不是这个问题,请帮忙回复一下,告诉我,我也好知道真相,非常感谢!
希望我的这个文章能够帮到你们,如果有用,请点个赞,谢啦!
也希望大家能够积极的发表文章能够实现知识共享。