【Linux 驱动】第六章 高级字符驱动程序操作 ----阻塞型I/O

时间:2022-01-09 00:06:19

 

     序言:试想如果在驱动方法中的read/write中,当数据不可用时,用户可能调用read,当输出缓冲区满时,设备并未准备好接受数据,这种情况下驱动程序可以阻塞该进程,并且置入休眠状态直到满足条件。


一, 休眠

   
          当一个进程休眠时,它会被标记为一种特殊状态并从调度器的运行队列中移走,直到某些情况修改了这个状态,进程才会在任意cpu上调度,即运行该进程。
   在linux下,为了让进程安全的进入休眠状态,有两条规则需要牢记:
 

         1)永远不要在原子上下文中休眠。

               说明:原子上下文:在执行多个步骤时,不能有任何并发访问。不能再拥有自旋锁,seqlock,rcu锁时休眠,进程1在拥有信号量时休眠是合法的,但是要确保进程1拥有信号量不会阻塞唤醒我们的那个进程2。

 
         2)对唤醒之后的状态不能做任何假定,必须检查以确保我们等待的条件为真。

       

      初始化一个等待队列有两种方法:

 
         1)静态
                DECLARE_WAIT_QUEUE_HEAD(my_queue);
         2)动态
               wait_queue_head_t    my_queue;

               init_waitqueue_head(&my_queue);


 一个等待队列由一个wait_queue_head_t 结构体来管理,其定义在<linux/wait.h>

struct __wait_queue_head {
    spinlock_t lock;
    struct list_head task_list;
};
typedef struct __wait_queue_head wait_queue_head_t;


   
二, 简单休眠
   
    等待队列:一个进程链表,包含了等待某个特定事件的所有进程
    在linux中,一个等待队列通过一个"wait queue head"来管理,类型为 wait_queue_head_t,在<linux/wait.h>中定义。
   
 
   休眠宏:  wait_event(queue,condition);  //queue是等待队列头  condition是boolea类型
                      wait_event_interruptible(queue,condition); //可以中断休眠
                      wait_event_timeout(queue,condition,timeout);//等待限定的时间
                      wait_event_interruptible_timeout(queue,condition,timeout);


     上述宏的调用如果condition条件不满足将引起调用进程的阻塞,并且宏会在休眠前后对condition求值,从名字可以看出带interruptible的宏用户可以中断休眠,返回非0值表示被中断,此时驱动程序要返回      -ERESTARTSYS.而带timeout的宏表示在给定的时间到期时,宏都会返回0.


   唤醒函数:


                   void   wake_up(wait_queue_head_t   *queue);
                   void   wake_up_interruptible(wait_queue_head_t    *queue);

wake_up会唤醒在queue上的所有进程,而wake_up_interruptible只唤醒那些可中断的进程。


三,高级休眠


  进程如何休眠?

       step1:分配初始化一个wait_queue_t 结构,然后加入到对应的等待队列。
 

       step2:通过函数set_current_state(int new_state)设置进程状态。

                      驱动程序关心的进程状态主要是TASK_RUNNING(可运行),TASK_INTERRUPTIBLE(可中断休眠),TASK_UNINTERRPUTIBLE(不可中断休眠)。


      step3:调用schedule(),记住在调用之前,必须先检查进入休眠的条件。如果不做检查会引入竞态: 如果在忙于上面的这个过程时有其他的线程刚刚试图唤醒你,你可能错过

  唤醒且长时间休眠,经典的检查代码如下:


             if(!condition)

                        schedule();

四,手工休眠  <linux/sched.h>中包含必须的定义

        (1)创建和初始化一个等待队列。常由宏定义完成:
                           DEFINE_WAIT(my_wait);   // name 是等待队列入口项的名字.
                    

                    方法二:

                     wait_queue_t    my_wait;
                     init_wait(&my_wait);
       

                 常用的做法是放一个 DEFINE_WAIT 在循环的顶部,来实现休眠。


 (2)添加等待队列入口到队列,并设置进程状态:
              void    prepare_to_wait(wait_queue_head_t     *queue, wait_queue_t    *wait, int    state); 
                   queue   等待队列头

                    wait   进程入口

                    state   进程的新状态:TASK_INTERRUPTIBLE(可中断休眠,推荐)或TASK_UNINTERRUPTIBLE(不可中断休眠,不推荐)。


(3)在检查确认仍然需要休眠之后调用 schedule
                      schedule();

(4)schedule 返回,就到了清理时间:
 

       void      finish_wait(wait_queue_head_t     *queue, wait_queue_t    *wait); 
  

      认真地看简单休眠中的 wait_event(queue, condition) 和 wait_event_interruptible(queue, condition) 底层源码会发现,其实他们只是手工休眠中的函数的组合。所以怕麻烦的话还是用wait_event比较好。





五, 独占等待

            当一个进程调用 wake_up 在等待队列上,所有的在这个队列上等待的进程被置为可运行的。 这在许多情况下是正确的做法。但有时,可能只有一个被唤醒的进程将成功获得需要的资源,而其余的将再次休眠。这时如果等待队列中的进程数目大,这可能严重降低系统性能。为此,内核开发者增加了一个“独占等待”选项

    独占等待进程与普通休眠进程的不同:

          1)等待队列入口设置了WQ_FLAG_EXCLUSIVE标志,并且添加到等待队列的尾部,没有这个标志的进程被添加到等待队列的头部。

           2)在某个等待队列上调用wake_up时,它会唤醒第一个具有WQ_FLAG_EXCLUSIVE标志的进程之后再唤醒其他进程。

   什么时候采用独占等待进程呢?满足以下两个条件可以考虑:

          1)对某个资源存在严重竞争。

          2)唤醒单个进程就能完整消耗该资源

六,唤醒的相关函数
       很少会需要调用wake_up_interruptible 之外的唤醒函数,但为完整起见,这里是整个集合:
              wake_up(wait_queue_head_t *queue); //唤醒队列中的每个非独占等待进程和一个独占等待进程
              wake_up_interruptible(wait_queue_head_t *queue); //过处于不可中断休眠的进程。它们在返回之前, 使一个或多个进程被唤醒、被调度(如果它们被从一个原子上下文调用, 这就不会发生)

              wake_up_nr(wait_queue_head_t *queue, int nr); 
              wake_up_interruptible_nr(wait_queue_head_t  *queue, int nr); 

              这些函数类似 wake_up, 除了它们能够唤醒多达 nr 个独占等待者, 而不只是一个. 注意传递 0 被解释为请求所有的互斥等待者都被唤醒 

             wake_up_all(wait_queue_head_t *queue); 
             wake_up_interruptible_all(wait_queue_head_t  *queue);      

            这种 wake_up 唤醒所有的进程, 不管它们是否进行独占等待(可中断的类型仍然跳过在做不可中断等待的进程)

             wake_up_interruptible_sync(wait_queue_head_t *queue); 
             一个被唤醒的进程可能抢占当前进程, 并且在 wake_up 返回之前被调度到处理器。 但是, 如果你需要不要被调度出处理器时,可以使用            wake_up_interruptible 的"同步"变体. 这个函数最常用在调用者首先要完成剩下的少量工作,且不希望被调度出处理器时。



七,阻塞和非阻塞操作


 设置非阻塞I/O


   显式的非阻塞I/O由filp->f_flags中的O_NONBLOCK标志决定,为了保持和System V代码兼容,标志O_NDELAY和O_NONBLOCK是一个意思,非阻塞io的read和write会返回-EAGAIN.


   应用程序有两种方式制定非阻塞IO: 


   1)在open的时候指定,用于在open调用可能会阻塞很长的时间。


   2)调用fcntl函数。具体使用方法可在网上查哦这里就不列出了。


阻塞操作的标准语义

    如果一个进程调用了read但是没有数据可读,进程阻塞,数据到达时进程被唤醒,并把数据返回给调用者,即使数据少于count;如果一个进程调用了write但是缓冲区满,该进程必须阻塞,休眠在与read进程不同的等待队列上,当缓冲区有空闲时,进程被唤醒,写入数据成功,即使写入了小于count的字节数。

一个阻塞IO的例子scullp


static ssize_t scull_p_read (struct file *filp, char __user *buf, size_t count, loff_t *f_pos)
{

        struct scull_pipe *dev = filp->private_data;
        if (down_interruptible(&dev->sem))
                return -ERESTARTSYS;

        while (dev->rp == dev->wp) { /* nothing to read */
                up(&dev->sem); /* release the lock */
                if (filp->f_flags & O_NONBLOCK)
                        return -EAGAIN;

                PDEBUG("\"%s\" reading: going to sleep\n", current->comm);

                if (wait_event_interruptible(dev->inq, (dev->rp != dev->wp)))
                        return -ERESTARTSYS; /* signal: tell the fs layer to handle it */

                if (down_interruptible(&dev->sem))

                        return -ERESTARTSYS;

        }

        /* ok, data is there, return something */

        if (dev->wp > dev->rp)
                count = min(count, (size_t)(dev->wp - dev->rp));

        else /* the write pointer has wrapped, return data up to dev->end */

                count = min(count, (size_t)(dev->end - dev->rp));

        if (copy_to_user(buf, dev->rp, count)) {

                up (&dev->sem);

                return -EFAULT;

        }

        dev->rp += count;

        if (dev->rp == dev->end)

                dev->rp = dev->buffer; /* wrapped */

        up (&dev->sem);

        /* finally, awake any writers and return */

       wake_up_interruptible(&dev->outq);

        PDEBUG("\"%s\" did read %li bytes\n",current->comm, (long)count);

        return count;

}