如果一个应用程序去处理多个设备,例如应用程序读取网路数据,按键,串口,一般能想到的有三种方法:
方法1:
串行+阻塞的方式读取:
while(1) {
read(标准输入);
read(网络);
}
缺点:每当阻塞读取标准输入时,如果用户不进行标准输入的操作,而此时客户端给服务器发送数据,导致服务器无法读取客户端发送来的数据!
方法2:
采用多线程或者多进程机制来实现读取:
开辟多个线程,每一个线程处理一个设备,不会导致的数据的无法读取,但是系统的开销相比方法1要大!
方案3:采用linux系统提供的高级IO的处理机制
select/poll:两者一样,主进程能够利用select或者poll能够对多个设备进行监听!
其原理好像:方法1相当于有一个保安,看十户房子,如果小偷进来从第十户开始偷,保安却从第一户挨个检查,没有小偷确还在第一家等着。
方法2相当于雇了十个保安,开销大
方法3相当于买了10套监控设备,一个保安看监控录像,有情况报警
************************************************************************************
select函数原型:
int select(int nfds,
fd_set *readfds,
fd_set *writefds,
fd_set *exceptfds,
struct timeval *timeout);
函数功能:
主进程利用此函数能够对多个设备进行监听,一旦发现监听的设备都不可用(不可读、也不可写、也没有异常),那么主进程进入休眠状态,一旦监听的设备中,只要有一个设备可用(可读或者可写或者有异常)都会唤醒休眠的主进程,select也就会返回。
注意这个函数仅仅起到一个监听的功能,数据的后续处理,例如读写都是通过read,write,ioctl来进行!
参数说明:
nfds:
对设备的访问永远先open获取fd;
监听的设备中,最大的文件描述符fd+1;
数据类型fd_set:文件描述符集合,用来保存描述监听的设备,里面存放是被监听设备的文件描述符;如果select要监听某一个设备,必须把这个设备的fd添加到对应的文件描述符集合中!
readfds:读文件描述符集合指针,如果select要监听设备是否可读,需将设备的fd添加到这个集合中!
writefds:写文件描述符集合指针,如果select要监听设备是否可写,需将设备的fd添加到这个集合中!
exceptfds:异常文件描述符集合指针,如果select要监听设备是否有异常,需将设备的fd添加到这个集合中!
注意:一个设备的fd可以同时添加到三个集合中!
timeout:指定监听的超时时间,如果此参数指定了一个时间,例如5秒钟,select发现设备不可用,主进程进入休眠状态,如果5秒之内设备还不可用,5秒到期,主进程主动唤醒;如果此参数指定为NULL,休眠为永久休眠!
返回值:有三种
如果等于0:表明是超时;
如果小于0:表明系统出错;
如果大于0:表明设备可用(至少是一个设备,或者全部);
文件描述符集合操作的方法:
fd_set rfds; //定义读文件描述符集合
//从集合中解除对fd设备的监听
void FD_CLR(int fd, fd_set *set);
//判断是否是设备fd引起的主进程的唤醒,如果是返回true,否则返回false
int FD_ISSET(int fd, fd_set *set);
//添加一个新的被监听的设备
void FD_SET(int fd, fd_set *set);
//清空文件描述符集合
void FD_ZERO(fd_set *set);
注意:如果要重复监听,需要再次清空集合和添加监听设备!
***********************************************************************************
以上是应用程序层面上的函数调用
其在内核层面上:
在sys_select中做休眠,poll不引起休眠
select系统调用过程:
1.应用程序调用select,首先调用C库的select函数实现;
2.C库的select保存select系统调用号到R7寄存器中,调用SVC(新的
)或者SWI(老的)触发软中断,至此由用户空间陷入内核空间,ARM
的工作模式由用户模式转变为SVC管理模式;
3.跳转到内核准备好的异常向量表的入口地址,根据R7保存的系统调
用号,以它为索引在系统调用表中找到对应的实现函数sys_select
4.sys_select要完成:
1.把被监听的设备对应驱动程序的poll函数挨个调用一遍,
被监听的设备都不可用时,它们的驱动的poll函数都返回0;
2.判断是否是驱动主动唤醒,还是超时唤醒,还是接收到信号唤醒;
3.如果即没有驱动主动唤醒,也没有超时唤醒,没有接收到信号,
sys_select调用poll_schedule_timeout主动让进程进入休眠;
4.假设被监听的设备中,有一个设备可用(可读或者可写或者异常
,硬件通过中断来判断),都会唤醒休眠的主进程;
5.sys_select的poll_schedule_timeout函数返回,不再休眠
6.再次把被监听的设备驱动的poll函数挨个调用一遍,此时可用
的设备对应的驱动poll函数会返回非0;
7.if (ret || time_out || ...) //ret = 1,立即返回到用户空
间,返回值为ret值
总结:
1.明确本来应该底层驱动的poll函数利用等待队列机制让进程休眠,
但是等待队列休眠9步骤并不都是驱动的poll来编写,有一部分是有内
核sys_select来实现;
2.驱动poll函数完成如下内容即可:
1.调用poll_wait,将当前进程添加到驱动定义的等待队列头中
2.根据设备是否可用,决定返回0还是非0
3.明确:监听机制,底层poll函数不是必须的,如果要监听设备还可
以使用多线程机制也能够完成监听;但是如果要使用select/poll监
听设备,驱动必须有poll实现!
下图是sys_select的简单实现:
通过对内核代码的分析,真正的休眠实现是在内核中实现的
poll_schedule_timeout函数中的schedule_hrtimeout_range中的schedule_hrtimeout_range_clock函数实现的
并不是在poll函数中实现的
poll(轮询)操作在应用程序中用于同时阻塞在多个文件上,当其中任何一个文件有应用程序所等待的事件(可读、可写、出错等)时,poll返回相应的掩码通知应用程序,使得应用程序知道应该对哪个文件做何种操作。按照我的理解,poll的本质可以这样解释:休眠等待多个指定文件中的任何一个发生特定的事件,并将被该文件唤醒;醒来后轮询所有相关文件(通过再次调用所有文件对应驱动的poll方法),获取所有被监控文件的事件信息返回给应用程序。
从这里就可以看出:
(1)其中等待队列的使用是必不可少的。实际上调用poll的进程将会休眠在多个等待队列(一般所有被监控文件的都有至少一个的等待队列)上,从其中任何一个队列上唤醒该进程,都可能使poll函数返回。
(2)驱动中的poll方法不实现休眠,而是:
- i、把当前进程添加到相应的等待队列中(仅在休眠时执行,唤醒时不会执行此功能)。
- ii、返回文件当前的状态掩码(告知是否有事件发生,休眠和唤醒都会执行)。
通过对内核源码、《深入Linux设备驱动程序内核机制》的学习,我对Poll系统调用和内核驱动的poll方法的关系和结构有了整体且深入的了解,基本搞清了poll系统调用的执行脉络。对于poll系统调用的内核原理,请大家先看《深入Linux设备驱动程序内核机制》那本书写的比较详细了,我不废话了。以后我会把我自己觉得需要注意的地方写出来。这里我把这个关系和数据结构图绘制了出来,请大家指正:
对于等待队列的情况,我用下面一个例子和图来示意一下:
例如有3个进程:
task-1:使用poll检测文件1~3
task-2:使用poll检测文件2~3
task-3:使用poll检测文件3