1.多线程的创建
import threading
t = t.theading.Thread(target, args……)
t.SetDeamon(True)//设置为守护进程
t.start(),启动线程
t.join(),阻塞当前线程,即使得在当前线程结束时,不会退出。会等到子线程结束之后才退出。
如果不加join语句,主线程不会等到子线程结束才结束,但却不会立即杀死该线程。
但是如果添加了SetDaemon(True),如果不加join,则会在主线程结束后马上杀死子线程。
如果join()加上时间,则会在一段时间之后再退出。
2.线程锁和Threadocal
(1)线程锁
多线程最大特点是线程之间可以共享数据,那么就会出现多线程之间同时改变一个变量,而出现死锁、数据错乱等情况。
比如,有一个global a, global b 有俩线程th1,th2,在某一时刻发生这样的情况:
th1拥有a,但是需要访问b;而th2拥有b,却需要访问a。
这时候th1,th2都互不相让,最后他们俩都饿死掉了。这就是死锁。
针对上述问题,出现了Lock,当访问某个资源之前先用Lock.acquire()锁住资源,访问之后再Lock.release()释放掉资源。
(2)TheadLocal
当不想将变量共享给其他线程时,可以使用局部变量,但是在函数中定义的局部变量使得在函数之间传递特别麻烦,TheadLocal就是特别的牛逼,了不起。
他解决了全局变量需要加锁,局部变量传递麻烦的两个问题。
local_school = theading.local()
定义一个Theadocal对象,此时local_school是一个全局变量,但是这个全局变量之能够在该线程中为全局变量,在其他线程看来他就是一个局部变量,别的线程不可更改之。
local_school = theading.local()
def process_thread(name):#绑定ThreadLocal的student
local_school.student = name
这个只有本线程可以修改,别的线程不可以。
ThreadLocal可以理解为一个dict,可以绑定不同的变量。
ThreadLocal使用最多的地方是每一个线程处理一个HTTP请求,在Flask框架中就是这个原理,它使用的是基于Werkzeug的LocalStack。
3.Map实现多线程
urls = ['www.google.com','www.luoxiaofeng.com', 'www.stackoverfolw.com']
results = map(urllib2.urlopen, urls)
map将每个元素当作参数分别传给urllib2.urlopen函数,并最后把结果放到results列表中。map一手包办了序列操作、参数传递和结果保存等一系列的操作。
其原理是将ruls中的每一个链接交给不同的cpu。map函数负责将线程分给不同的cpu。
在python中有两个库包含了map函数:mutilprocessing和它的子库multiprocessing.dummy。dummy是一个multiprocessing模块的完整克隆,唯一不同的是multiprocessing作用与进程,而dummy模块作用雨线程。
pool = ThreadPool()#创建县城池
results = pool.map(urllib2.urlopen, urls)#将不同的url传给各自的线程,并把执行结果返回到results中。
print results
pool.close()
pool.join()
4.Python多线程的缺陷:
不是真正多线程,因为有一个GIL,全局解释锁,该锁的存在保证在同一时间只有一个线程在真正执行任务,也就是多线程不是真正并发,只是交替的执行。假如有10个线程在10个cpu上,当前工作也只能是一个cpu上的线程。
5.应用场景:
适合在IO密集型任务中。因为I/O密集型执行期间大部分时间是用在I/O上,如数据库I/O,较少时间用在CPU计算上。因此,此场景可以使用python多线程,当一个任务阻塞在IO操作上时,我们可以立即切换执行其他线程上的其他IO操作请求。