综述
多线程是程序设计中的一个重要方面,尤其是在服务器Deamon程序方面。无论何种系统,线程调度的开销都比传统的进程要快得多。
Python可以方便地支持多线程。可以快速创建线程、互斥锁、信号量等等元素,支持线程读写同步互斥。美中不足的是,Python的运行在Python 虚拟机上,创建的多线程可能是虚拟的线程,需要由Python虚拟机来轮询调度,这大大降低了Python多线程的可用性。希望高版本的Python可以 解决这个问题,发挥多CPU的最大效率。
网上有些朋友说要获得真正多CPU的好处,有两种方法:
1.可以创建多个进程而不是线程,进程数和cpu一样多。
2.使用Jython 或 IronPython,可以得到真正的多线程。
闲话少说,下面看看Python如何建立线程
Python线程创建
使用threading模块的 Thread类
类接口如下
需要关注的参数是target和args. target 是需要子线程运行的目标函数,args是函数的参数,以tuple的形式传递。
以下代码创建一个指向函数worker 的子线程
...
th = threading.Thread(target=worker,args=(i,acc) ) ;
启动这个线程
等待线程返回
或者th.join()
如果你可以对要处理的数据进行很好的划分,而且线程之间无须通信,那么你可以使用:创建=》运行=》回收的方式编写你的多线程程序。但是如果线程之间需要访问共同的对象,则需要引入互斥锁或者信号量对资源进行互斥访问。
下面讲讲如何创建互斥锁
创建锁
....
使用锁
#锁定,从下一句代码到释放前互斥访问
g_mutex.acquire()
a_account.deposite(1)
#释放
g_mutex.release()
最后,模拟一个公交地铁IC卡缴车费的多线程程序
有10个读卡器,每个读卡器收费器每次扣除用户一块钱进入总账中,每读卡器每天一共被刷10000000次。账户原有100块。所以最后的总账应该为10000100。先不使用互斥锁来进行锁定(注释掉了锁定代码),看看后果如何。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
|
import time,datetime
import threading
def worker(a_tid,a_account):
global g_mutex
print ( "Str " , a_tid, datetime.datetime.now() )
for i in range ( 1000000 ):
#g_mutex.acquire()
a_account.deposite( 1 )
#g_mutex.release()
print ( "End " , a_tid , datetime.datetime.now() )
class Account:
def __init__ ( self , a_base ):
self .m_amount = a_base
def deposite( self ,a_amount):
self .m_amount + = a_amount
def withdraw( self ,a_amount):
self .m_amount - = a_amount
if __name__ = = "__main__" :
global g_mutex
count = 0
dstart = datetime.datetime.now()
print ( "Main Thread Start At: " , dstart)
#init thread_pool
thread_pool = []
#init mutex
g_mutex = threading.Lock()
# init thread items
acc = Account( 100 )
for i in range ( 10 ):
th = threading.Thread(target = worker,args = (i,acc) ) ;
thread_pool.append(th)
# start threads one by one
for i in range ( 10 ):
thread_pool[i].start()
#collect all threads
for i in range ( 10 ):
threading.Thread.join(thread_pool[i])
dend = datetime.datetime.now()
print ( "count=" , acc.m_amount)
print ( "Main Thread End at: " , dend, " time span " , dend - dstart)
|
注意,先不用互斥锁进行临界段访问控制,运行结果如下:
从结果看到,程序确实是多线程运行的。但是由于没有对对象Account进行互斥访问,所以结果是错误的,只有3434612,比原预计少了很多。
打开锁后:
这次可以看到,结果正确了。运行时间比不进行互斥多了很多,不过这也是同步的代价。
同时发现,写多线程,多进程类的程序,不能用自带的idle来运行。会有错误。