摘自《Linux 环境编程:从应用到内核》
在 Linux 中,目前的线程实现是 Native POSIX Thread Library,简称 NPTL。在这种实现下,线程又被称为轻量级进程(Light Weighted Process),每一个用户态的线程,在内核中都有一个调度实体,也拥有自己的进程描述符。
对于进程,可以使用下面的系统调用,获取进程 ID
pid_t getpid(void);
如:
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h> int main()
{
pid_t pid = getpid();
printf("pid = %d\n", pid);
while();
return ;
}
打印:
jingyg@jingyg:~/share/mytest/linux_userspace/$ gcc -g -Wall 0_1_hello_world.c -o hello_world
jingyg@jingyg:~/share/mytest/linux_userspace/$ ./hello_world
pid =
使用 ps 命令查看进程 ID,(加 -L 选项可以显示线程信息,LWP:线程 ID(调用 gettid()系统调用的返回值),NLWP:线程组内的线程个数)
jingyg@jingyg:~$ ps -efL
UID PID PPID LWP C NLWP STIME TTY TIME CMD
jingyg : pts/ :: ./hello_world
可以看到 PID 和 LWP 的值一样。
多线程的进程,又被称作线程组,线程组内的第一个线程,在用户态被称作主线程(main thread)。内核在创建第一个线程时,会将线程组 ID (即进程 ID) 的值设置为第一个线程的线程 ID。
虽然 Linux 提供了 gettid 系统调用来返回线程 ID,但是可惜的是 glibc 并没有将该系统调用封装并开放给程序员使用。如果确实需要获取线程 ID,可以采用如下方法:
#include <sys/syscall.h>
int TID = syscall(SYS_gettid);
如
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
#include <sys/syscall.h> int main()
{
pid_t pid = getpid();
printf("pid = %d\n", pid); int tid = syscall(SYS_gettid);
printf("tid = %d\n", tid);
return ;
}
打印:
jingyg@jingyg:~/share/mytest/linux_userspace/$ ./hello_world
pid =
tid =
pthread_self()
pthread 库中有一个 pthread_self() 接口用来获取线程 ID,但是这个 ID并不是内核中那个线程 ID
#include <pthread.h>
pthread_t pthread_self(void);
pthread_t 到底是个什么样的数据结构呢?因为 POSIX 标准并没有限制 pthread_t 的数据类型,所以该类型取决于具体实现。对于 Linux 目前使用的 NPTL 实现而言,pthread_t 类型的线程 ID,本质上就是一个进程地址空间上的一个地址,而且 pthread_t 类型的线程 ID很有可能被复用:
#include <stdio.h>
#include <pthread.h> void* thread_work(void* param)
{
printf("pthread_self : %p\n", (void*)pthread_self());
return NULL;
} int main()
{
pthread_t tid = ;
int ret = pthread_create(&tid, NULL, thread_work, NULL);
ret = pthread_join(tid, NULL); ret = pthread_create(&tid, NULL, thread_work, NULL);
ret = pthread_join(tid, NULL);
return ;
}
打印:(编译 pthread 相关接口时,需要加上 -lpthread 选项,如 gcc -g -Wall 0_1_hello_world.c -o hello_world -lpthread)
jingyg@jingyg:~/share/mytest/linux_userspace/$ ./hello_world
pthread_self : 0xb7525b40
pthread_self : 0xb7525b40
如果线程退出了,重新创建的线程很可能复用同一个 pthread_t 类型的 ID。在设计调试日志时,用 pthread_t 类型的 ID 来标识进程就不太合适了。
采用 pid_t 类型的线程 ID 来唯一标识进程由以下优势:
- 返回类型是 pid_t 类型,进程之间不会存在重复的线程 ID,而且不同线程之间也不会重复,在任意时刻都是全局唯一的值
- proc 中记录了线程的相关信息,可以方便的查看 /proc/pid/task/tid 来获取线程对应的信息
- ps 命令提供了查看线程信息的 -L 选项,可以通过输出中的 LWP 和 NLWP,来查看同一个线程组的线程个数和线程 ID 的信息
如:
#include <stdio.h>
#include <pthread.h>
#include <sys/syscall.h> void* thread_work(void* param)
{
int tid = syscall(SYS_gettid);
printf("tid : %d\n", tid);
sleep();
return NULL;
} int main()
{
pthread_t tid1 = ;
pthread_t tid2 = ;
pthread_t tid3 = ;
int ret = pthread_create(&tid1, NULL, thread_work, NULL);
ret = pthread_create(&tid2, NULL, thread_work, NULL);
ret = pthread_create(&tid3, NULL, thread_work, NULL); ret = pthread_join(tid1, NULL);
ret = pthread_join(tid2, NULL);
ret = pthread_join(tid3, NULL);
return ;
}
ps 命令查看线程 ID:
jingyg@jingyg:~$ ps -efL | grep hello_world
jingyg : pts/ :: ./hello_world
jingyg : pts/ :: ./hello_world
jingyg : pts/ :: ./hello_world
jingyg : pts/ :: ./hello_world
查看 proc:
jingyg@jingyg:~$ ll /proc//task/
total
dr-xr-xr-x jingyg jingyg Jul : ./
dr-xr-xr-x jingyg jingyg Jul : ../
dr-xr-xr-x jingyg jingyg Jul : /
dr-xr-xr-x jingyg jingyg Jul : /
dr-xr-xr-x jingyg jingyg Jul : /
dr-xr-xr-x jingyg jingyg Jul : /