网上有一篇《Linux下的多线程编程》介绍的比较详细,细读了一遍,颇有收获!
linux下的多线程模型:
可用getconf -a |grep GNU_LIBPTHREAD_VERSION查看,我的机器用的是redhat公司研发的NPTL 2.3.4。
pthread实现的简单说明:
pthread的实现通过系统调用clone()来实现。顺便说一下fork/vfork/clone三者的区别(底层均调用do_fork函数):
1. fork:完全复制,深度拷贝,使用copy-on-write技术。父子进程同时执行,均不阻塞。“是unix内核创建一个新进程的唯一方法(不包括交换进程、init进程和页精灵进程,这些进程是由内核作为自举过程的一部分以特殊方式创建的)。”----摘自《unix高级环境编程8.3节》
2. vfork:共享地址空间,子进程先运行,直到它调用exit或者exec后父进程才运行。
3. clone:定制性创建进程(或线程)。linux下的pthread就是通过系统调用clone来实现的。共享内存(CLONE_VM)、文件系统访问计数(CLONE_FS)、文件描述符表(CLONE_FILES)、信号处理方式(CLONE_SIGHAND)。
pthread函数族
很多函数直接man看一下就知道函数是干嘛的,有什么用,这里我只拣几个说说:
1.pthread_exit 和pthread_join合用,取得子线程的返回码:
线程中止,可以:在线程函数中return;被同一进程中的另外线程cancel掉;线程调用pthread_exit函数。
1.1 线程函数return:
1.2 被cancel掉:
调用pthread_cancel,非阻塞调用,应该是向内核一级发送cancel信号。如何处理cancel信号,则由目标线程自己决定:立即终止、忽略、继续运行至cancel_point(默认方式)。
pthread_testcancel(); retcode = read(fd, buffer, length); pthread_testcancel();
如果被cancel掉,pthread_join得到的返回值就是PTHREAD_CANCELLED(-1)
1.3 调用pthread_exit
pthread_exit((void*)10);
2. 线程创建时的属性设置pthread_create第二个参数
pthread_attr_t:主要包括作用域、是否分离、堆栈地址、堆栈大小、优先级等。
(见多线程编程—线程属性)
2.1 作用域:
pthread_attr_setscope(&attr,PTHREAD_SCOPE_SYSTEM|PTHREAD_SCOPE_PROCESS);
这里准确的理解,应该是定义线程争夺资源的scope(系统级or进程级):The contentionscope attribute may have the valuesPTHREAD_SCOPE_SYSTEM, signifying system scheduling contention scope, orPTHREAD_SCOPE_PROCESS, signifying process scheduling contention scope
2.2 是否分离:
线程的分离状态,决定一个线程以什么样的方式终止自己。默认的非分离状态(PTHREAD_CREATE_JOINABLE)下,只有当pthread_join函数返回以后,创建线程才算终止,才能释放自己占用的系统资源,否则会造成内存的泄露。分离状态(PTHREAD_CREATE_DETACHED)下,线程运行结束,立即释放系统资源,没有被其他线程等待。
注意:在分离状态下,线程有可能在pthread_create函数返回前就结束,并且有可能将线程号和系统资源移交给其他线程,这样,pthread_create返回得到的线程id就是错误的。可以使用线程同步机制来避免这种情况!
2.3 堆栈地址:
可以设置线程的堆栈在用户自己申请的堆栈地址中运行。
2.4 堆栈大小:
ulimit-a可以看到stack的大小限制,在线程属性里设置堆栈大小,可以突破这个限制。相应的,还有设置警戒缓冲区大小的pthread_attr_setguardsize函数。
2.5 优先级(调度参数):
系统支持的最大和最小优先权值可以用sched_get_priority_max函数和sched_get_priority_min函数分别得到。如果不是编写实时程序,不建议修改。因为,调度策略是一件非常复杂的事情,如果不正确使用会导致程序错误,从而导致死锁等问题。如:在多线程应用程序中为线程设置不同的优先级别,有可能因为共享资源而导致优先级倒置。
3.pthread的TSD(线程特有数据)
线程的私有全局变量(同名不同地址)。仅在某个线程中有效,但可以跨多个函数使用。比如常见的errno就是一个TSD。pthread_key_delete用来删除一个键,这个键占用的内存将被释放,但是,它并不释放该键关联的线程数据所占用的资源,也不会触发pthread_key_create中定义的destructor函数。详见:《posix线程编程指南》
pthread实例分析
1、 内存泄露:
源码:
分析:很显然,有内存泄露,既没有设置线程的分离属性,也没有使用pthread_join等待线程结束。
解决:
可以设置线程的分离属性:
或者实现自我分离:
在线程函数中pthread_detach(pthread_self());
注意:The effect of multiplepthread_detach() calls on the same target thread is unspecified.
或者使用pthread_join等待
pthread_join(pt,NULL);
2、 对死循环的子线程进行停止操作
设置线程对cancel信号的处理方式
pthread_setcancelstate(PTHREAD_CANCEL_ENABLE,NULL); //允许退出线程
设置立即取消或者延迟取消
pthread_setcanceltype(PTHREAD_CANCEL_ASYNCHRONOUS,NULL); //设置立即取消
pthread_setcanceltype(PTHREAD_CANCEL_DEFERRED,NULL); //设置延迟取消
注意,延迟取消需要设置cancel_point(可增加pthread_testcancel)
使用pthread_cancel发送cancel信号
pthread_cancel(pthread);