本課主題

Python中的作用域补充
socketserver 源码
线程的介绍和操作实战
进程的介绍和操作实战
协程的介绍和操作实战
本周作业

Python中的作用域补充

Python世界里沒有块级作用域的：在 Java/C+ 世界里没法打印 name。

# 在 Java/C+ 世界里没法打印 name

# 但在 Python/ JavaScript 世界里可以打印 name

>>> if 1 == 1:

...     name = 'Janice'

...

>>> print(name)

Janice

Python中无块级作用域(小知识点一)

>>> for i in range(10):

...    name = i

...

>>> print(name)

9

Python中无块级作用域(小知识点二)

但在 Python/ JavaScript 世界里可以打印 name。在 Python 中是以函数作为作用域。

>>> del name

>>> def func():

...     name = 'Janice'

...

>>> print(name)

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

NameError: name 'name' is not defined

Python 中是以函数作为作用域(小知识点三)

Python是有作用域链条，对于作用域来说，在函数没有执行之前，它的作用域已经确定啦，作用域链也已经确定啦

>>> name = 'alex'

＃ 这是 f1()是作用域，它是一个内部的作用域

>>> def f1():

...     print(name)

... 

# 这是 f2()是作用域

>>> def f2():

...     name = 'eric'

...     f1()

... 

>>> f2()

alex

Python是有作用域链条(小知识点四)

>>> name = 'alex'

＃ 这是 f1()是作用域，它是一个内部的作用域

>>> def f1():

...     print(name)

... 

# 这是 f2()是作用域

>>> def f2():

...     name = 'eric'

...     return f1

... 

>>> ret = f2()

>>> ret() # 这相当于运行 f1()

alex

Python是有作用域链条(小知识点五)

For 循环，然后把每一个元素都加1，最后生成一个列表

# 它会执行一个 For 循环，然后把每一个元素都加1，最后生成一个列表

li = [x+1 for x in range(10) if x > 6]

print(li)

Python lambda + for 循环(小知识点六)

>>> li2 = [lambda :x for x in range(10)]

>>> ret = li2[0]()

>>> print(ret)

9

Python lambda + for 循环(小知识点七)

>>> li = []

>>> for i in range(10):

...     def f1(x=i):

...        return x

...

...     li.append(f1)

...

>>> print(li[0]())

0

>>> print(li[1]())

1

>>> print(li[2]())

2

Python lambda + for 循环(小知识点八)

socketserver 源码

第十章：Python の网络编程基础(二)

图片来源在此

IO操作就是输入输出，其实它不会一直占用 CPU 的，这个IO多路复用目的是在管理IO操作，用来监听socket 对象的内部是否变化了，如果有一个机制可以同时监听多个客户端的连接，就可以实现接受多连接，IO多路复用主要是用 select, poll 和 epoll 来实现这个功能。

Socket内部什么时候会有变化？

当连接或者是收发消息的时候，socket 内部会产生变化，当客户端连接服务器端时，服务器端接收的一刻 e.g. conn, addrs = sk.accept( )。它的 socket 对象就会产生变化，如果服务器端的socket对象发生变化，代表有新连接进来了，然后会创建一个新的 socket 对象。

select 模块

调用 select 模块中的方法来实现IO多路复用

rlist, wlist, e = select.select(inputs,outputs,[],1)

xxxxxx

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# Author: Janice Cheng

import socket

import select

#select 中有一个功能就是用来监听socket 对象的内部是否变化了

sk = socket.socket()

sk.bind(("127.0.0.1",8088,))

sk.listen(5)

# 这个 input 可以是 sk,或者是接受 message

inputs = [sk,]

outputs = []

message = {}

#message = {

#   Janice: [message1, message2]

#}

while True:

    # 监听 sk(服务器端)对象，如果sk发生变化，表示有客户端来连接了，此时 rlist值为[sk]

    # 监听 conn 对象，如果conn发生变化，表示客户端有新消息发送过来了，此时 rlist值为[客户端]

    # 第一个参数: select会监听sk，判断是否有新连接，有的话就会新增到 rlist，它获取的就是 socket 的对象列表

    # 第二个参数: wlist 有所有给我发过消息的人

    # 第三个参数: 是一个错误列表

    # 第四个参数: 是超时时间

    rlist, wlist, elist = select.select(inputs,outputs,[],1)

    print(len(inputs),len(rlist), len(wlist), len(outputs))

    for r in rlist:

        if r == sk: # 因为只有 sk 才有 sk.accept()方法

            # 新客户端来连接

            conn, addr = r.accept() # 接受一个客户端的连接

            #conn是什么? 其实也是一个 socket 对象

            inputs.append(conn) #添加到 inputs 那个列表中 [sk,sk1]

            message[conn] = []

            conn.sendall(bytes('Hello client-side', encoding='utf-8'))

        else:

            # 接受消息

            # 不是 sk 而且能加入 rlist，就表示有人给我发消息

            print("=========")

            try:

                ret = r.recv(1024)

                # r.sendall(ret)

                if not ret:

                    raise Exception("断开连接")

                else:

                    outputs.append(r)

                    message[r].append(ret)

            except Exception as e:

                inputs.remove(r)

                del message[r]

    # wlist 有所有给我发过消息的人

    for w in wlist:

        msg = message[w].pop()

        resp = bytes("response: ",encoding = 'utf-8') + msg

        w.sendall(resp)

        outputs.remove(w)

sk.close()

IO多路复用(服务器端)

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# Author: Janice Cheng

import socket

sk=socket.socket()

sk.connect(("127.0.0.1",8088,))

data = sk.recv(1024)

print(data.decode())

while True:

    inp = input(">>> ")

    if inp == 'q': break

    sk.sendall(bytes(inp,encoding='utf-8'))

    print(sk.recv(1024))

sk.close()

IO多路复用(客户端)

用到了IO多路复用：监听 socket 内部是否变化，在它连接 conn.accept( ) 或者是收发消息 conn.sendall( )/ conn.recv(1024) 的时候，内部会产生变化

多线程、多进程、协程

rlist 中获取的就是 socket的对象列表

线程的介绍和操作实战

什么是多线程

线程就是程序执行时的基本单位，我们平常写的一些脚本一般都是单线程单进程的应用程序，一个应用程序其实可以创建多条线程，以達到提高程序运行的并发度，就可以有更高的效率。在 Python 世界裡有一個叫全区解释器锁 GIL，如果你要占用 CPU 的话，默应每次只能用一个线程去处理。

第十章：Python の网络编程基础(二)

什么情况下用多线程，和多进程会发挥最大的效果?

一个应用程序可以有多线程和多进程，目的在于让CPU 能充份地运用，在Python 里有一个叫GIL，全区解释器锁，如果不用CPU 的话，在Python 就可以实现并发执行，因为IO 操作不占用CPU，一般用多线程；对于计算性操作一些需要占用CPU的，一般会使用多进程来提高并发。

创建线程有两种方法：

创建 threading.Thread( ) 方法
```
t=threading.Thread(target=f1, args=(123,))

t.start()
```
创建线程(方法一)

自定义 MyThread,继承者threading.Thread( )

class MyThread(threading.Thread):

    def __init__(self, target, args):

        self.target = target

        self.args = args

        super(MyThread,self).__init__()

    def run(self):

        self.target(self.args)

def f2(args):

    print(args)

obj = MyThread(target=f2, args=(123,))

obj.start()

创建线程(方法二)

线程其他方法：

创建了 t = threading.Thread( )对象之后,可以使用一些方法根据你的逻辑，设计线程的调度。

t.setDaemon( ):
t.join(n):

import time

def f1():

    time.sleep(2)

    print('f1')

import threading

t = threading.Thread(target=f1) # 创建子线程

t.setDaemon(True) # True 表示主线程不等子线程，直接运行主线程的程序完毕就终止

t.start()

t.join() # 它会先等子线程执行完毕，再运下它下面的代码，表不主线程到此等待，直到子线程执行完毕

t.join(2) # 参数表主线程在此最多等待n秒

print('end')

线程(其他小知识)

线程锁

什么是线程锁，线程锁就是锁定程序，当它被处理的时候，去确保只有一个线程在运理程序，这是用来确保数据一致性。有什麼作用呢？

import threading

import time

NUM = 10

def func():

    global NUM

    NUM -= 1

    time.sleep(1)

    print(NUM)

for i in range(10):

    t = threading.Thread(target=func)

    t.start()

没有线程锁的程序

线程锁有以下几种：

threading.Lock( ): 同一时刻只有一个线程来操作，它只能有一把锁。

import threading

import time

NUM = 10

def func(l):

    global NUM

    l.acquire() # 上锁

    NUM -= 1

    time.sleep(1)

    print(NUM)

    l.release() # 开锁

lock = threading.Lock() # 只能锁一次

for i in range(10):

    t = threading.Thread(target=func, args=(lock,))

    t.start()

线程锁 threading.Lock()

threading.RLock( )：可以允许多层锁的嵌套。

import threading

import time

NUM = 10

def func(l):

    global NUM

    l.acquire() # 上锁

    NUM -= 1

    l.acquire()  # 上锁

    l.release() # 开锁

    time.sleep(1)

    print(NUM)

    l.release() # 开锁

lock = threading.RLock() # 多层锁的嵌套

for i in range(10):

    t = threading.Thread(target=func, args=(lock,))

    t.start()

线程锁 threading.RLock()

threading.BoundedSemaphore(n)：信号量，允许一定数目(n)的线程同时执行

import threading

import time

NUM = 10

def func(i, l):

    global NUM

    l.acquire() # 上锁

    NUM -= 1

    time.sleep(1)

    print(NUM, i)

    l.release() # 开锁

lock = threading.BoundedSemaphore(2) # 每次只放 X 個

for i in range(10):

    t = threading.Thread(target=func, args=(i, lock,))

    t.start()

线程锁 threading.BoundedSemaphore(n)

threading.Event( )：事件，批量将所有线程都挡住，这里要注意3个方法：event.wait( )、event.clear( ) 和 event.set( )

event.wait( ) #检查当前是什么灯，默应是红灯

event.clear() #主动设置成红灯

event.set() #主动设置成绿灯

import threading

def func(i,e):

    print(i)

    e.wait() # 检查当前是什么颜色的灯: 如果是红灯，停; 如果是绿灯，行。默应Flag是False 表示是 红灯

    print(i + 100)

event = threading.Event()

for i in range(10):

    t = threading.Thread(target=func, args=(i,event))

    t.start()

event.clear() # 设置成红灯

inp = input(">>> ")

if inp == '':

    event.set() # 设置成绿灯

线程锁 threading.Event()

threading.Condition( )：满足自定义条件后，可以放出一条线程。

import threading

def func(i, con):

    print(i)

    con.acquire()  #上条件锁

    con.wait()

    print(i+100)

    con.release() #开锁

c = threading.Condition()

for i in range(10):

    t = threading.Thread(target=func, args=(i,c))

    t.start()

while True:

    inp = input(">>> ")

    if inp == 'q':

        break

    else:

        c.acquire() #上锁

        c.notify(int(inp)) # 放出多少数据

        c.release() #开锁

线程锁 threading.Condition( )方法一

import threading

def condition():

    ret = False

    r = input(">>> ")

    if r:

        ret = 'True'

    else:

        ret = 'False'

    return ret

def func(i, con):

    print(i)

    con.acquire()  #上锁

    con.wait_for(condition)

    print(i+100)

    con.release() #开锁

c = threading.Condition()

for i in range(10):

    t = threading.Thread(target=func, args=(i,c))

    t.start()

线程锁 threading.Condition( )方法二

threading.Timer( )：

import threading

def hello():

    print("hello world")

t = threading.Timer(1, hello)

t.start() # 一秒之后 hello world 就会打印出来

线程锁 threading.Timer( )

自定义线程池

线程其实不是愈多愈好，必需跟据系统的 CPU 的个数来定的。线程池的概念是需要维护一个池，可以允许特定人数的人来连接，如果已经到达线程池的上限的话，其他的运接就必需等待着，等到有空闲的线程才可以连接，就像排队一样。

什么是线程池，又有什么用呢?

自定义线程池有以下几个元素：

一个容器
取一个少一个
无线程时必须等待
线程执行完毕,交还线程

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# Author: Janice Cheng

import queue

import threading

import time

class ThreadPool:

    def __init__(self, maxsize):

        self.maxsize = maxsize

        self._q = queue.Queue(maxsize)

        for i in range(maxsize):

            self._q.put(threading.Thread) # 添加threading.Thread的类到消息对列中

    def get_thread(self):

        return self._q.get() # 获取一个类

    def add_thread(self):

        self._q.put(threading.Thread) # 新增一个threading.Thread

pool = ThreadPool(5)

# 添加5个 threading.Thread 的类

# [threading.Thread,threading.Thread,threading.Thread,threading.Thread,threading.Thread]

def task(arg,p):

    print(arg)

    time.sleep(1)

    p.add_thread()

# 假设有100个任务

for i in range(100):

    # threading.Thread 类

    t = pool.get_thread()

    obj = t(target=task, args=(i,pool,)) #threading.Thread(target=func, args=(i,c))

    obj.start()

自定义线程池(低级版本)

#!/usr/bin/env python

# -*- coding:utf-8 -*-

import queue

import threading

import contextlib

import time

StopEvent = object()

class ThreadPool(object):

    def __init__(self, max_num, max_task_num = None):

        if max_task_num:

            self.q = queue.Queue(max_task_num)

        else:

            self.q = queue.Queue()

        self.max_num = max_num

        self.cancel = False

        self.terminal = False

        self.generate_list = []

        self.free_list = []

    def run(self, func, args, callback=None):

        """

        线程池执行一个任务

        :param func: 任务函数

        :param args: 任务函数所需参数

        :param callback: 任务执行失败或成功后执行的回调函数，回调函数有两个参数1、任务函数执行状态；2、任务函数返回值（默认为None，即：不执行回调函数）

        :return: 如果线程池已经终止，则返回True否则None

        """

        if self.cancel:

            return

        if len(self.free_list) == 0 and len(self.generate_list) < self.max_num:

            self.generate_thread()

        w = (func, args, callback,)

        self.q.put(w)

    def generate_thread(self):

        """

        创建一个线程

        """

        t = threading.Thread(target=self.call)

        t.start()

    def call(self):

        """

        循环去获取任务函数并执行任务函数

        """

        current_thread = threading.currentThread()

        self.generate_list.append(current_thread)

        event = self.q.get()

        while event != StopEvent:

            func, arguments, callback = event

            try:

                result = func(*arguments)

                success = True

            except Exception as e:

                success = False

                result = None

            if callback is not None:

                try:

                    callback(success, result)

                except Exception as e:

                    pass

            with self.worker_state(self.free_list, current_thread):

                if self.terminal:

                    event = StopEvent

                else:

                    event = self.q.get()

        else:

            self.generate_list.remove(current_thread)

    def close(self):

        """

        执行完所有的任务后，所有线程停止

        """

        self.cancel = True

        full_size = len(self.generate_list)

        while full_size:

            self.q.put(StopEvent)

            full_size -= 1

    def terminate(self):

        """

        无论是否还有任务，终止线程

        """

        self.terminal = True

        while self.generate_list:

            self.q.put(StopEvent)

        self.q.queue.clear()

    @contextlib.contextmanager

    def worker_state(self, state_list, worker_thread):

        """

        用于记录线程中正在等待的线程数

        """

        state_list.append(worker_thread)

        try:

            yield

        finally:

            state_list.remove(worker_thread)

# How to use

pool = ThreadPool(5)

def callback(status, result):

    # status, execute action status

    # result, execute action return value

    pass

def action(i):

    print(i)

for i in range(30):

    ret = pool.run(action, (i,), callback)

time.sleep(5)

print(len(pool.generate_list), len(pool.free_list))

print(len(pool.generate_list), len(pool.free_list))

# pool.close()

# pool.terminate()

自定义线程池(武Sir的高级版本)

第十章：Python の网络编程基础(二)

进程的介绍和操作实战

GIL 的存在使得 Python 中的多线程无法充分利用多核的优势来提高性能，因而提出了多进程来解决这个问题

每个进程里都有自己的内存空间，而且数据默应是不会共享的

基本使用

进程锁

进程锁跟线程锁也是一样的

from multiprocessing import Process

from multiprocessing import Array

from multiprocessing import RLock,Lock,Event,Condition

import time

def foo(i,lis, lc):

    lc.acquire()

    lis[0] = lis[0] - 1

    time.sleep(1)

    print('say hi',lis[0])

    lc.release()

if __name__=='__main__':

    li = Array('i',10)

    li[0] = 10

    lock = RLock()

    for i in range(10):

        p = Process(target=foo, args=(i,li,lock,))

        p.start()

进程锁

默应数据不共享

如何让进程之间的数据可以共享？

对列的方式：queues.Queue

数组的方式：Array

from multiprocessing import Process

from multiprocessing import queues

import multiprocessing

from multiprocessing import Array

def foo(i,arg):

    arg[i] = i + 100

    for item in arg:

        print(item)

    print("=============")

if __name__=='__main__':

    li = Array('i',10)

    for i in range(10):

        p = Process(target=foo, args=(i,li,))

        #p.daemon=True

        p.start()

        #p.join()

数组的方式

创建对象的方式：Manager( )

进程池

线程的生命周期分为 5 个状态：创建、就绪、运行、阻塞和终止、自线程创建到终止，线程便不断在就绪、运行和阻塞这三个状态之间转换直至销毁。而真正占有 CPU 的只有创建、运行和销毁这3个状态。一个线程的运行时间可以分为3部分

线程的启动时间 (Ts)
线程体的运行的时间 (Tr)
线程的销毁时间 (Td)

在多线程处理的场境下，如果线程不能被重用，就意味著每次创建都需要经过启动、运行和销毁这3个过程，这必然会增加系统的相应时间，降底效率。

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# Author: Janice Cheng

from multiprocessing import Pool

import time

def f1(arg):

    time.sleep(1)

    print(arg)

if __name__=='__main__':

    pool = Pool(5) # 最多有5个进程的进程池

    for i in range(30): # 创建30个任务

        # pool.apply(func=f1, args=(i,)) # 到进程池拿一个进程来进行穿形的操作处理数据

        pool.apply_async(func=f1, args=(i,))

    # pool.close() # 必须等待所有任务执行完毕才会终止程序。

    time.sleep(1)

    pool.terminate() # 立即终止程序，程序一遇到 terminate()就会立即终止程序。

    # pool.join() # 状态必须是CLOSE, TERMINATE,如果不是就会报错。assert self._state in (CLOSE, TERMINATE)

    print('end')

进程池 Pool

协程的介绍和操作实战

协程的原理是利用一个线程，分解一个线程成为多个微线程，这是程序级别做的，它更适合于 IO操作。

greenlet

from greenlet import greenlet

# 通过 greenlet 可以控制一下线程，让它先执行一个再执行下一个，

def test1():

    print('------12-------')

    gr2.switch() # 转换并执行一下对象 gr2

    print('------34-------')

    gr2.switch() # 转换并执行一下对象 gr2

def test2():

    print('------56-------')

    gr1.switch() # 转换并执行一下对象 gr1

    print('------78-------')

gr1=greenlet(test1)

gr2=greenlet(test2)

gr1.switch() # 转换并执行一下对象 gr1

"""

------12-------

------56-------

------34-------

------78-------

"""

greenlet例子

gevent

import gevent

def foo():

    print("Running foo")

    gevent.sleep(0)

    print("Explicit context switch to foo again!")

def bar():

    print("Running bar")

    gevent.sleep(0)

    print("Explicit context switch back to bar")

gevent.joinall([

    gevent.spawn(foo),

    gevent.spawn(bar)

])

"""

Running foo

Running bar

Explicit context switch to foo again!

Explicit context switch back to bar

"""

gevent例子

xxxxx

本周作业

day10作业

參考資料

[1] 银角大王：Python之路【第六篇】：socket

[2] 银角大王：Python之路【第七篇】：线程、进程和协程

[3] 银角大王：Python之路线程池参考例子

[4] 金角大王：

[5] Python的GIL是什么鬼，多线程性能究竟如何

[6] Parallelism in one line

秒客网

第十章：Python の网络编程基础(二)

本課主題

Python中的作用域补充

socketserver 源码

select 模块

线程的介绍和操作实战

什么是多线程

创建线程有两种方法：

线程其他方法：

线程锁

线程锁有以下几种：

自定义线程池

进程的介绍和操作实战

基本使用

进程锁

默应数据不共享

进程池

协程的介绍和操作实战

本周作业

參考資料

相关文章

第十章：Python の 网络编程基础(二)

本課主題

Python中的作用域补充

socketserver 源码

select 模块

线程的介绍和操作实战

什么是多线程

创建线程有两种方法：

线程其他方法：

线程锁

线程锁有以下几种：

自定义线程池

进程的介绍和操作实战

基本使用

进程锁

默应数据不共享

进程池

协程的介绍和操作实战

本周作业

參考資料

相关文章

第十章：Python の网络编程基础(二)