问题描述:
从业务抽离出来大概是这样:大概是如下的场景,这个程序跑了40分钟后,pthread_create返回11,创建失败。
int i=0;
void play_handle(){
i=0;
for(;i<5;i++){
sleep(1);
printf("i=%d\n",i);
}
i=6;
return;
}
int main(){
while(1){
int tid;
int ret =pthread_create(&tid,NULL,play_handle,NULL);
if(0 != ret){
printf("pthread_create error ,ret = %d\n",ret);
}
}
while(i!=6){
sleep(1);
}
}
}
11对应的描述是描述是:Resource temporarily unavailable,系统资源暂时不可用。
经过百度、google,对返回11的解决有两个方式:
创建的线程数量太多,超过了系统限制
参考:https://blog.csdn.net/m0_67505608/article/details/123528500
获取系统最大进程id,也就是最多能创建的进程数:
cat /proc/sys/kernel/pid-max
获取系统最大线程id
cat /proc/sys/kernel/threads-max
查看当前进程创建的线程只有14个,不是这个问题
查看当前进程创建的线程数量:
top 输入H
cat /proc/pid/tasks/ 看里面有多少个线程id,这些数据都是实时更新的
cat /proc/pid/status 看thread这项
线程资源没有回收,导致系统资源不足
从现象来看,进程的vmsize随着时间推移不断升高,在报错时达到了3G,而vmsize的意义是进程使用的虚拟内存大小。达到3G已经到了32位系统用户空间所能管理的最大值,所以pthread_create失败。
解决办法
使用pthread_join在线程退出时回收线程资源
在创建线程时使用pthread_attr_setdetachstate设置线程的属性为分离态,当线程退出时自动释放资源。
pthread_join
参考:https://blog.csdn.net/weibo1230123/article/details/81410241
以及UNIX环境高级编程
线程可分为可结合的(joinable)和分离的(detached)两种,如果没有在创建线程时设置线程的属性为PTHREAD_CREATE_DETACHED,则线程默认是可结合的。可结合的线程在线程退出后不会释放系统资源(比如栈空间),必须要调用pthread_join来显示的结束线程。
使用pthread_join的好处是可以监听线程的返回值,根据返回值判断线程退出的状态。
pthread_attr_setdetachstate
如果对某个线程的终止状态不感兴趣,可以通过pthread_detach设置它的属性为PTHREAD_CREATE_DETACHED,可分离,线程终止时自动释放资源。
以分离状态创建线程的例子