流水作业调度问题(不能直接使用动态规划法的例子)
流水作业调度的定义:
设有n个作业,每一个作业i均被分解为m项任务:
Ti1, Ti2, ┅ , Tim(1≤i≤n,故共有n×m个任务),
要把这些任务安排到m台机器上进行加工。
如果任务的安排满足下列3个条件,
则称该安排为流水作业调度:
1. 每个作业i的第j项任务Tij (1≤i≤n, 1≤j≤m)
只能安排在机器Pj上进行加工;
2. 作业i的第j项任务Tij(1≤i≤n, 2≤j≤m)的开始加工时间
均安排在第j-1项任务Ti,j-1加工完毕之后;
(任何一个作业的任务必须依次完成,前一项任务完成之后才能开始着手下一项任务)
3. 任何一台机器在任何一个时刻最多只能承担一项任务。
最优流水作业调度:
设任务Tij在机器Pj上进行加工需要的时间为tij。
如果所有的tij (1≤i≤n, 1≤j≤m)均已给出,
要找出一种安排任务的方法,
使得完成这n个作业的加工时间为最少。
这个安排称之为最优流水作业调度。
完成n个作业的加工时间:
从安排的第一个任务开始加工, 到最后一个任务加工完毕,
其间所需要的时间。
优先调度:
允许优先级较低的任务在执行过程中被中断,
转而去执行优先级较高的任务。
非优先调度:
任何任务一旦开始加工,就不允许被中断,
直到该任务被完成。
流水作业调度一般均指的是非优先调度。
非优先调度可看成是特殊的优先调度:
所有任务的优先级均相同。
7 5 8
e.g. (tij)= 2 2 6
0 7 4
注意:tij为0表示作业i无须在机器Pj上进行加工、
即该道工序可以省略。
已经证明,当机器数(或称工序数)m≥3时,
流水作业调度问题是一个NP-hard问题(e.g分布式任务调度)。
(粗糙地说,即该问题至少在目前
基本上没有可能找到多项式时间的算法。)
∴ 只有当m=2时,该问题可有多项式时间的算法。
为方便起见,记ti1为ai(作业i在P1上加工所需时间),
ti2为bi(作业i在P2上加工所需时间)。
当机器P1为空闲即未安排任何加工任务时,
则任何一个作业的第一个任务(第一道工序)
都可以立即在P1上执行,无须任何先决条件。
因此容易知道,
必有一个最优调度使得在P1上的加工是无间断的。
实际上,如某个最优调度π在P1上安排的加工是有间断的,
则我们可以把所有在P1上出现间断处的任务的
开始加工时间提前,使得在P1上的加工是无间断的;
而在P2上仍按π原先的安排。
把这样调整之后的调度记作为π’。
由于在调度π’下,任何一个任务在P1上加工的结束时间
不晚于在调度π下的结束时间,故调度π’
不会影响在P2上进行加工的任何一个任务的开始时间。
由于调度π’在P1上的结束时间早于调度π,
在P2上的结束时间与调度π相同,而π又是最优调度,
所以π’也是最优调度。由此我们得到:
一定有一个最优调度使得在P1上的加工是无间断的。
另外,也一定有一个最优调度使得在P2上的加工空闲时间
(从0时刻起算)为最小,
同时还满足在P1上的加工是无间断的。(证明留作作业)
因此,如果我们的目标是只需找出一个最优调度,
我们可以考虑找:在P1上的加工是无间断的、
同时使P2的空闲时间为最小的最优调度。
(根据上述理由,这样的最优调度一定存在。)
可以证明,若在P2上的加工次序与在P1上的加工次序不同,
则只可能增加加工时间(在最好情况下,增加的时间为0)。
也就是说,在P1上的加工次序已确定的情况下,
至少有一个最优调度,
其在P1上的加工次序与在P2上的加工次序是完全相同的
(这一点对m≥3不成立)。
因此,当只需找到一个最优调度时,
我们仅需要考虑在P1和P2上加工次序完全相同的调度。
以下的讨论均以此为前提。
为简化起见,我们假定所有ai≠0。因为如果有ai=0的作业,
我们可以先对所有ai≠0的作业进行调度,
然后把所有ai=0的作业放到最前面执行(可按任意次序)。
最优调度具有如下性质:
在所确定的最优调度的排列中去掉第一个执行作业后,
剩下的作业排列仍然还是一个最优调度,
即该问题具有最优子结构的性质。
而且,在计算规模为n的作业集合的最优调度时,
该作业集合的子集合的最优调度会被多次用到,
即该问题亦具有高度重复性。
这就引导我们考虑用动态规划法求解。
然而,正如我们下面将会看到的,
虽然使用动态规划法可以得到一些有用的结果,
但如果不加以某种改进,
完全照搬动态规划法会使得算法的时间复杂度成为指数量级。
问题求解的思路如下。
设N={1,2,┅,n}是全部作业的集合,
作业集S是N的子集合即有S 属于N。
在我们对S中的第一个作业开始进行加工时,
机器P2上加工的其它作业可能还尚未完成,
不能立即用来对S中的作业进行加工。
假设对机器P2需等待t个时间单位以后
才可以用于S中的作业加工(t也可以为0即无须等待),
并记g(S,t)为在此情况下完成S中全部作业的最短时间,
则可用下述递归表达式来表出g(S,t):
g(S,t)=mini∈S{ai+ g(S-{i},bi+max{t-ai,0})} (*)
即:当选定作业i为S中第一个加工作业之后,
在机器P2上开始对S-{i}中的作业进行加工之前,
所需要的等待时间为bi+max{t-ai,0}。
这是因为,
若P2在开始加工S中的作业之前需等待t个时间单位且t > ai,则作业i在P1上加工完毕(需时ai)之后,
还要再等t-ai个时间单位才能开始在P2上加工;
若t≤ai,则作业i在P1上加工完毕之后,立即可以在P2上加工,
等待时间为0。故P2在开始对S-{i}中的作业进行加工之前,
所需要的等待时间为bi+max{t-ai,0}。
(bi是作业i在P2上加工所需的时间)。
当S=N即全部作业开始加工时,
由于P2上尚无任何正在加工的作业,故此时等待时间t=0。
于是我们有:g(N,0)=min1≤i≤n{ai+ g(N-{i},bi)}
虽然根据(*)式我们可以编写出计算g(N,0)的程序,
但该算法的时间复杂度为指数量级,
因为算法中对N的每一个非空子集都要进行一次计算,
而N的非空子集共有2n-1个。
因此,我们不能直接使用动态规划法来求解该问题,
而需要对算法作一定的改进。
设π是作业子集S的某一个调度,
该调度首先安排作业i,其次安排作业j,
P2需等待t个时间单位以后才可以用于S中的作业加工。
记t’= bi+max{t-ai,0},则由(*)式调度π的g(S,t)可写为
g(S,t)=ai+ g(S-{i}, t’)= ai+ aj+ g(S-{i,j}, bj+max{t’-aj,0})。
由于x+ max{y1, y2,?,yn}= max{x+y1,x+y2,?,x+yn},,
t’= bi+max{t-ai,0},
所以bj+max{t’-aj,0}=
bj+max{bi+max{t-ai,0}-aj, 0}= bj+bi - aj+max{max{t-ai,0},aj-bi}
=bj+ bi - aj +max{t-ai, 0, aj-bi}
=bj+ bi - aj - ai +max{t, ai, ai+aj-bi}。
记tij= bj+ bi - aj - ai +max{t, ai, ai+aj-bi}(= bj+max{t’-aj,0}),
则调度π的g(S,t)=ai+ aj+ g(S-{i,j}, tij)。
将调度π中的作业i与j的加工次序交换(其它加工次序不变)
所得调度记为π’,
则调度π’的最早完工时间g’(S,t)=ai+ aj+ g(S-{i,j}, tji)。
显然,若tij ≤ tji,
则有g(S,t) ≤ g’(S,t)即i在前j在后的安排用时较少;
反之,若tij >tji,则j在前i在后的安排用时较少。
因此,我们要找出判断tij与tji之间的大小关系的表达式。
由于tij-tji= max{t, ai, ai+aj-bi}- max{t, aj, ai+aj-bj},
故我们只要比较
max{t, ai, ai+aj-bi}与max{t, aj, ai+aj-bj}的大小就可以了,
即tij ≤ tji当且仅当max{t, ai, ai+aj-bi} ≤ max{t, aj, ai+aj-bj}。
由于max{t, ai, ai+aj-bi} ≤ max{t, aj, ai+aj-bj}
对任何t ≥ 0成立,当且仅当
max{ai, ai+aj-bi} ≤ max{aj, ai+aj-bj}成立,当且仅当
ai+aj+max{-aj, -bi} ≤ ai+aj+max{-ai, -bj}成立,当且仅当
max{-aj, -bi} ≤ max{-ai, -bj}成立,当且仅当
min{aj, bi} ≥ min{ai, bj}成立(此式称为Johnson不等式)。
即当min{ ai , aj , bi , bj}为ai或者bj时,Johnson不等式成立,
此时把i排在前j排在后的调度用时较少;
反之,若min{ ai , aj , bi , bj}为aj或者bi时,
则j排在前i排在后的调度用时较少。
将此情况推广到一般。
当min{ a1, a2,┅, an , b1, b2,┅, bn }=ak时,
则对任何i≠k,都有min{ai, bk} ≥ min{ak, bi}成立,
故此时应将作业k安排在最前面,
作为最优调度的第一个执行的作业;
当min{ a1, a2,┅, an , b1, b2,┅, bn }= bk时,
则对任何i≠k,也都有min{ak, bi}≥min{ai, bk}成立,
故此时应将作业k安排在最后面,
作为最优调度的最后一个执行的作业。
n个作业中首先开工(或最后开工)的作业确定之后,
对剩下的n-1个作业采用相同方法可再确定其中的一个作业,
应作为n-1个作业中最先或最后执行的作业;
反复使用这个方法直到最后只剩一个作业为止,
最优调度就确定了。
e.g. n=4, (a1, a2, a3, a4)=(5,12,4,8), (b1, b2, b3, b4)=(6,2,14,7)。
(a1, a2, a3, a4)与(b1, b2, b3, b4)合起来排序的结果为(2,4,5,6,7,8,12,14)=(b2,a3,a1,b1,b4,a4,a2, b3)。
最小数是b2,故作业2应安排为最后一个作业:π(4)←2。
次小数是a3,故作业3应安排为第一个作业:π(1)←3。
第3小数是a1,故作业1应安排为第二个作业:π(2)←1。
第4小数是b1,因作业1已安排过,故转去看下一个数。
第5小数是b4,故作业4应安排为倒数第二个作业:π(3)←4。至此,所有作业均已安排完毕。本例的调度图解如下。
求解该问题的算法如下。
1. 建立长为2n的数组C,将a1, a2,┅, an依次放入C[1]~ C[n]中,b1, b2,┅, bn依次放入C[n+1]~ C[2n]中。
2. 对长为2n的数组D进行初始化:D[1]~ D[n]中依次放1,2,┅,n,D[n+1]~ D[2n]中依次放-1,-2,┅,-n。
3. 对数组C进行排序,D[k]始终保持与C[k]的对应关系。
(若C[i]与C[j]对换,则D[i]也与D[j]对换。
或将C,D放在同一结构体中。)
当a1, a2,┅, an及b1, b2,┅, bn按从小到大次序排好之后,
D[1]~ D[2n]也就按从小到大的次序记录了这些ai和bj的下标即作业号(bj的下标前有一负号以区别于ai))。
4. 将E[1]~ E[n]全部置为“No”。
5. 下标变量初始化:i←1;j←n;k←1;
6. while i ≤ j do {
if D[k] > 0 then {if E[D[k]]为“No”then
{F[i]←D[k]; i增1; E[D[k]] 置为“Yes”}}
else if E[–D[k]]为“No”then
{F[j]←–D[k]; j减1; E[–D[k]] 置为“Yes”}}
k增1;}
算法分析:
第1,2,4句的初始化均只需要O(n)时间,
第3句的排序需要O(n log n)时间,
第5句的下标变量初始化只需要O(1)时间,
至于第6句的循环,由于在D[1]~ D[2n]中放的是1,2,┅,n,
-1,-2,┅,-n共2n个数,(注意C数组排序后次序已经打乱)
且每执行一次循环k均增1,故当执行2n次时,
D数组中存放的每一个m或-m(m=1,2,┅,n)都会被遇到,
若m先遇到,则使得i增1;若-m先遇到,则使得j减1,
故最多执行完k=2n-1时,必然要有i > j,使得循环中止。
∴算法的时间复杂度为O(n log n)。
小结:
满足1)高度重复性 2)最优子结构性质 时,
一般采用动态规划法,但偶尔也得不到高效的算法。
若问题本身不是NP-hard问题,
那么进一步分析后有可能获得效率较高的算法。
若问题本身就是NP-hard问题,
那么与其它的精确算法相比,动态规划法一般性能不算太坏,
但有时也需要对动态规划法作进一步的加工。