在进程描述符中进入几个字段来表示进程之间的父子关系和兄弟关系。
图3-4显示了一组进程间的亲属关系。
表3-4:建立非亲属关系的进程描述符字段
在某些情况下,内核必须能从进程的PID到处对应的进程描述符指针,顺序扫描进程链表并检查进程描述符的pid字段是可行但相当低效的。为了加速查找,引入了4个散列表。需要4个散列表是因为进程描述符包含了表示不同类型PID的字段,而且每种类型PID需要它自己的散列表。
散列函数并不能总能确保PID与表的索引一一对应。两个不同的PID散列(hash)到相同的表索引称为冲突(colliding)。Linux利用链表来处理冲突的PID:每一个表项是由冲突的进程描述符组成的双向链表。图3-5显示了具有两个链表的PID散列表。进程号(PID)为2890和29384的两个进程散列到这个表的第200个元素,而进程号(PID) 为29385的进程散列到这个表的第1466个元素。
具有链表的散列法比从PID到表索引的线性转换更优越。
PID散列表最主要的数据结构是4个PID结构的数组,它在进程描述符的pid字段,表3-6显示了pid结构的字段。
图3-6给出了PIDTYPE_TGID类型散列表的例子。pid_hash数组的第二个元素存放散列表的地址,也就是hlist_head结构的数组表示链表的头。散列表第71项为起点行程的链表中,有两个PID号为246和4351的进程描述符(双箭头线表示一对向前和向后的指针)。PID的值存放在pid结构的nr字段中,而pid结构在进程描述符中,(顺便提一下,由于进程组的号和它的首创者的PID相同,因此这些PID值也存在进程描述符PID字段中。)我们考虑线程组4351的PID链表:散列表中的进程描述符的pid_list字段中存放链表的头,同时每个PID链表中指向前一个元素和后一个元素的指针也存放每个链表元素的pid_list字段中。