python多任务-线程

多任务的概念
线程基础
线程-注意点

多任务的概念

什么叫“多任务”呢？简单地说，就是操作系统可以同时运行多个任务。打个比方，你一边在用浏览器上网，一边在听MP3，一边在用Word赶作业，这就是多任务，至少同时有3个任务正在运行。还有很多任务悄悄地在后台同时运行着，只是桌面上没有显示而已。

现在，多核CPU已经非常普及了，但是，即使过去的单核CPU，也可以执行多任务。由于CPU执行代码都是顺序执行的，那么，单核CPU是怎么执行多任务的呢？

答案就是操作系统轮流让各个任务交替执行，任务1执行0.01秒，切换到任务2，任务2执行0.01秒，再切换到任务3，执行0.01秒……这样反复执行下去。表面上看，每个任务都是交替执行的，但是，由于CPU的执行速度实在是太快了，我们感觉就像所有任务都在同时执行一样。

真正的并行执行多任务只能在多核CPU上实现，但是，由于任务数量远远多于CPU的核心数量，所以，操作系统也会自动把很多任务轮流调度到每个核心上执行。

注意：

并发：指的是任务数多余cpu核数，通过操作系统的各种任务调度算法，实现用多个任务“一起”执行（实际上总有一些任务不在执行，因为切换任务的速度相当快，看上去一起执行而已）
并行：指的是任务数小于等于cpu核数，即任务真的是一起执行的

线程基础

python的thread模块是比较底层的模块，python的threading模块是对thread做了一些包装的，可以更加方便的被使用

单线程执行

import time

def test():

        print("test...")

        time.sleep(1)

if __name__ == '__main__':

        for i in range(5):

                test()

执行效果：程序在控制台每隔一秒打印test...

多线程执行

import time

import threading

def test():

        print("test...")

        time.sleep(1)

if __name__ == '__main__':

        for i in range(5):

                t = threading.Thread(target=test)

                t.start() # 启动线程

执行效果：程序在控制台一下子输出五行test...，等待1秒左右结束

说明：

可以明显看出使用了多线程并发的操作，花费时间要短很多
当调用start()时，才会真正的创建线程，并且开始执行

主线程会等待所有子线程结束后才结束

import time

import threading

def playPhone():

        print('玩手机...')

        time.sleep(1)

def eat():

        print("吃东西...")

        time.sleep(1)

if __name__ == '__main__':

        print("--开始--")

        t1 = threading.Thread(target=playPhone)

        t1.start()

        t2 = threading.Thread(target=eat)

        t2.start()

        print('--执行结束')

执行效果：主线程阻塞1秒左右后程序结束，说明主线程在等待其他线程执行完毕。

查看线程数量

          print('玩手机...')

                time.sleep(1)

def eat():

        for i in range(10):

                print("吃东西...")

                time.sleep(1)

if __name__ == '__main__':

        print("--开始--")

        t1 = threading.Thread(target=playPhone)

        t1.start()

        t2 = threading.Thread(target=eat)

        t2.start()

        # 查看正在执行的线程数量

        while True:

                length = len(threading.enumerate())

                print("当前运行的线程数量：%d" % length)

                print("这些线程是：%s" % str(threading.enumerate()))

                if length == 1:

                        break

                time.sleep(0.5)    

        print('--执行结束')

在python中，调用threading.enumerate()能获取当前正在运行的所有线程，返回值是一个list，调用length()函数并传入该list对象就获取到当前运行线程的数量。

线程-注意点

线程执行代码的封装

通过上一篇，能够看出，通过使用threading模块能完成多任务的程序开发，为了让每个线程的封装性更完美，所以使用threading模块时，往往会定义一个新的子类class，只要继承threading.Thread就可以了，然后重写run方法。

示例如下：

import time

import threading

class MyThread(threading.Thread):

        def run(self):

                for i in range(5):

                        time.sleep(1)

                        print("我是%s@%d" % (self.name, i)) 

if __name__ == "__main__":

        mt = MyThread()

        mt.start()

运行结果如下：

我是Thread-1@0

我是Thread-1@1

我是Thread-1@2

我是Thread-1@3

我是Thread-1@4

python的threading.Thread类有一个run方法，用于定义线程的功能函数，可以在自己的线程类中覆盖该方法。而创建自己的线程实例后，通过Thread类的start方法，可以启动该线程，交给python虚拟机进行调度，当该线程获得执行的机会时，就会调用run方法执行线程。

线程的执行顺序

mport time

import threading

class MyThread(threading.Thread):

        def run(self):

                for i in range(5):

                        time.sleep(1)

                        print("我是%s@%d" % (self.name, i)) 

if __name__ == "__main__":

        for i in range(5):

                mt = MyThread()

                mt.start()

执行结果(运行的结果可能不一样，但是大体是一致的)：

我是Thread-5@0

我是Thread-2@0

我是Thread-3@0

我是Thread-4@0

我是Thread-1@0

我是Thread-3@1

我是Thread-4@1

我是Thread-2@1

我是Thread-5@1

我是Thread-1@1

我是Thread-3@2

我是Thread-4@2

我是Thread-2@2

我是Thread-5@2

我是Thread-1@2

我是Thread-3@3

我是Thread-4@3

我是Thread-2@3

我是Thread-5@3

我是Thread-1@3

我是Thread-3@4

我是Thread-4@4

我是Thread-5@4

我是Thread-2@4

我是Thread-1@4

从代码和执行结果我们可以看出，多线程程序的执行顺序是不确定的。当执行到sleep语句时，线程将被阻塞（Blocked），到sleep结束后，线程进入就绪（Runnable）状态，等待调度。而线程调度将自行选择一个线程执行。上面的代码中只能保证每个线程都运行完整个run函数，但是线程的启动顺序、run函数中每次循环的执行顺序都不能确定。

总结

每个线程默认有一个名字，尽管上面的例子中没有指定线程对象的name，但是python会自动为线程指定一个名字。
当线程的run()方法结束时该线程完成。
无法控制线程调度程序，但可以通过别的方式来影响线程调度的方式。

秒客网