linux多线程编程学习心得

时间:2022-09-29 16:25:17

 

网上有一篇《Linux下的多线程编》介绍的比较详细,细读了一遍,颇有收获!

linux下的多线程模型:

可用getconf -a |grep GNU_LIBPTHREAD_VERSION查看,我的机器用的是redhat公司研发的NPTL 2.3.4

 

pthread实现的简单说明:

pthread的实现通过系统调用clone()来实现。顺便说一下fork/vfork/clone三者的区别(底层均调用do_fork函数):

 

1. fork:完全复制,深度拷贝,使用copy-on-write技术。父子进程同时执行,均不阻塞。unix内核创建一个新进程的唯一方法(不包括交换进程、init进程和页精灵进程,这些进程是由内核作为自举过程的一部分以特殊方式创建的)。”----摘自《unix高级环境编程8.3节》

 

2. vfork:共享地址空间,子进程先运行,直到它调用exit或者exec后父进程才运行。

 

3. clone:定制性创建进程(或线程)。linux下的pthread就是通过系统调用clone来实现的。共享内存(CLONE_VM)、文件系统访问计数(CLONE_FS)、文件描述符表(CLONE_FILES)、信号处理方式(CLONE_SIGHAND)

pthread函数族

很多函数直接man看一下就知道函数是干嘛的,有什么用,这里我只拣几个说说:

 

1.pthread_exit pthread_join合用,取得子线程的返回码:


线程中止,可以:在线程函数中return;被同一进程中的另外线程cancel掉;线程调用pthread_exit函数。

 

1.1 线程函数return

 

1.2 cancel掉:

调用pthread_cancel,非阻塞调用,应该是向内核一级发送cancel信号。如何处理cancel信号,则由目标线程自己决定:立即终止、忽略、继续运行至cancel_point(默认方式)。

POSIX标准,pthread_join()pthread_testcancel()pthread_cond_wait()pthread_cond_timedwait()sem_wait()sigwait()等函数以及read()write()等会引起阻塞的系 统调用都是Cancelation-point,而其他pthread函数都不会引起Cancelation动作。但是pthread_cancel的手 册页声称,由于LinuxThread库与C库结合得不好,因而目前C库函数都不是Cancelation-pointCANCEL信号会使线程从阻 塞的系统调用中退出,并置EINTR错误码,因此可以在需要作为Cancelation-point的系统调用前后调用 pthread_testcancel(),从而达到POSIX标准所要求的目标,即如下代码段:

pthread_testcancel();    retcode = read(fd, buffer, length);    pthread_testcancel();


如果被cancel掉,pthread_join得到的返回值就是PTHREAD_CANCELLED(-1)


 

1.3 调用pthread_exit


pthread_exit((void*)10);



2. 线程创建时的属性设置pthread_create第二个参数


pthread_attr_t:主要包括作用域、是否分离、堆栈地址、堆栈大小、优先级等。

 

(见多线程编程—线程属性

 

2.1  作用域:

 

pthread_attr_setscope(&attr,PTHREAD_SCOPE_SYSTEM|PTHREAD_SCOPE_PROCESS);

这里准确的理解,应该是定义线程争夺资源的scope(系统级or进程级):The  contentionscope attribute may have the valuesPTHREAD_SCOPE_SYSTEM, signifying system scheduling contention scope, orPTHREAD_SCOPE_PROCESS, signifying process scheduling contention scope

 

2.2 是否分离:

 

线程的分离状态,决定一个线程以什么样的方式终止自己。默认的非分离状态(PTHREAD_CREATE_JOINABLE)下,只有当pthread_join函数返回以后,创建线程才算终止,才能释放自己占用的系统资源,否则会造成内存的泄露。分离状态(PTHREAD_CREATE_DETACHED)下,线程运行结束,立即释放系统资源,没有被其他线程等待。

注意:在分离状态下,线程有可能在pthread_create函数返回前就结束,并且有可能将线程号和系统资源移交给其他线程,这样,pthread_create返回得到的线程id就是错误的。可以使用线程同步机制来避免这种情况!

 

2.3 堆栈地址:

 

可以设置线程的堆栈在用户自己申请的堆栈地址中运行。

 

2.4 堆栈大小:

 

ulimit-a可以看到stack的大小限制,在线程属性里设置堆栈大小,可以突破这个限制。相应的,还有设置警戒缓冲区大小的pthread_attr_setguardsize函数。

 

2.5  优先级(调度参数):


系统支持的最大和最小优先权值可以用sched_get_priority_max函数和sched_get_priority_min函数分别得到。如果不是编写实时程序,不建议修改。因为,调度策略是一件非常复杂的事情,如果不正确使用会导致程序错误,从而导致死锁等问题。如:在多线程应用程序中为线程设置不同的优先级别,有可能因为共享资源而导致优先级倒置。

 

3.pthreadTSD(线程特有数据)

 

线程的私有全局变量(同名不同地址)。仅在某个线程中有效,但可以跨多个函数使用。比如常见的errno就是一个TSDpthread_key_delete用来删除一个键,这个键占用的内存将被释放,但是,它并不释放该键关联的线程数据所占用的资源,也不会触发pthread_key_create中定义的destructor函数。详见:《posix线程编程指南

pthread实例分析

1、  内存泄露:

 

源码:

 

分析:很显然,有内存泄露,既没有设置线程的分离属性,也没有使用pthread_join等待线程结束。

 

解决:

 

可以设置线程的分离属性:

 

 

或者实现自我分离:

在线程函数中pthread_detach(pthread_self());

注意:The effect of multiplepthread_detach() calls on the same target thread is       unspecified.

 

或者使用pthread_join等待

pthread_join(pt,NULL);


2、  对死循环的子线程进行停止操作

 

设置线程对cancel信号的处理方式

pthread_setcancelstate(PTHREAD_CANCEL_ENABLE,NULL);      //允许退出线程  


设置立即取消或者延迟取消

 pthread_setcanceltype(PTHREAD_CANCEL_ASYNCHRONOUS,NULL);        //设置立即取消

pthread_setcanceltype(PTHREAD_CANCEL_DEFERRED,NULL);             //设置延迟取消

注意,延迟取消需要设置cancel_point(可增加pthread_testcancel)


使用pthread_cancel发送cancel信号

pthread_cancel(pthread);