前面一片博文介绍了调度实例的状态,下面简单介绍一下什么是调度器。
调度器最朴素的解释就是 医院的挂号排队系统
当到医院去看病的时候,首先会去挂号,然后拿到一个号码,门诊室外的电子叫号装置会根据号码来进行排队叫号。
对应的调度器把新创建的线程赋予一个线程ID,然后放入到Ready队列中,当排队轮到此线程时,将其放入处理器中运行。
所以我们可以简单将处理器类比为医生,线程类比为病人,并且由于病人需要各种化验等检查(线程会需要阻塞在各种资源之上),当拿到检查报告之后会返回到医生哪里继续诊断(线程拿到阻塞的资源也会返回到处理器继续执行)。所以我们可以简单的把调度器当成一个门诊医院。
而操作系统调度器的核心就是排队的算法, 为什么会需要复杂的算法来处理对调度实例的排队问题呢? 因为我们的任务有不同的优先级,并且实际运行的情况也不同比如一个耗费CPU较多的处理器密集型任务,或者是经常等待各种资源的IO密集型任务,它们的实际运行情况是十分不同的。(比如一个病人一直在跟医生瞎扯,那他一定会长时间的阻塞其他进程的执行,而相反的如果一个病人有许多检查,每次医生只需要看一下化验单就安排下次检查,这两种情况对后续门诊病人的排队是很不相同的)
所以当前的操作系统内核一般支持多任务优先级的,算法复杂度为O(1)的,多队列调度算法。而通常情况下为了应付不同的任务响应需求,还会有不同的调度算法来应付实时抢占,批处理等各种不同的任务类型,例如Linux操作系统中的SCHED_RR/SCHED_FIFO。
那操作系统调度器设计的核心是什么呢? 简单总结为一句话就是合理的把处理器资源在多个不同的任务之间分配,来尽量满足每个任务的响应时间,执行速度的需求。
例如对于一个实时的小内核,它很可能只有32个任务优先级,并且按照一种朴素的当高优先级任务执行完了才执行低优先级任务的思路将不同的任务放到不同的处理器中运行,所以对于这种操作系统其调度算法往往很简单,他有32个按照优先级的队列,而将不同的调度实例按照优先级和FIFO的顺序排列,然后当上下文切换通过调度器选择下一个要执行的任务时按照优先级从高到低的顺序,从队列上取第一个任务去执行。而切其任务的优先级不会被调度器进行惩罚而改变。
相应的对应的Linux的CFS调度器就会复杂许多,它会平衡考虑不同的任务,并且根据任务执行时间的统计对其进行优先级的调整从而保证每个任务尽量得到均衡的时间相应和执行时间。(详情推荐去看专门的CFS的文章,比我讲的清楚)
而对应的大部分操作系统都会给每个任务一个时间片,什么时间片简单的理解就是当前任务在一个时间统计周期(通常是1秒)能够运行的时间配额,当超过此配额的时候调度器一般会对此类任务进行优先级的调整,或者是单纯的将其排在对应有限级的队列尾部,对其作为超额执行的惩罚。