python自动化之装饰器

1 高阶函数

满足下列条件之一就可成函数为高阶函数

某一函数当做参数传入另一个函数中

函数的返回值包含n个函数,n>0

高阶函数示范

def bar():

    print 'in the bar'

def foo(func):

    res=func()

    return res

foo(bar)

foo(bar)()等价于先bar=foo(bar) 再 bar()

2 内嵌函数和变量作用域

定义：在一个函数体内创建另外一个函数，这种函数就叫内嵌函数(基于python支持静态嵌套域)

嵌套函数示例

def foo():         #定义函数foo()，

    m=3            #定义变量m=3;

    def bar():     #在foo内定义函数bar()

        n=4        #定义局部变量n=4

        print m+n  #m相当于函数bar()的全局变量

     bar()         #foo()函数内调用函数bar()

当运行bar函数的时候，会首先找局部变量发现没有m，就会去父函数里找，发现有m，就会引用。这就是嵌套函数，而引用外部变量的嵌套函数就被称为闭包。

3 闭包

定义：如果在一个内部函数里，对在外部作用域(但不是在全局作用域）的变量进行引用，那么内部函数就被认为是 closure（闭包）

def counter(start_num=0):

    count = [start_num]

    def incr():

        count[0] += 1

        return count[0]

    return incr

print(counter())   #1

print(counter()()) #2

print(counter()()) #3

c = counter()      #4

print(c())         #5

print(c())         #6

#####运行结果#####

#1运行结果  <function counter.<locals>.incr at 0x0053D390> //返回incr这个函数变量在内存中的地址

#2运行结果  1 //先运行counter函数得到incr这个函数变量，再运行incr（）得到结果1

#3运行结果  1//因为先运行了counter函数所以会初始化start_num为0，所以结果还是1

#5运行结果  1//把incr这个函数变量赋给c这个对象然后运行会得到incr（）结果

#6运行结果  2//此时count[0]=1,所以直接执行这个会继续使count[0]加1，所以运行结果为2。

4 装饰器初识

定义：装饰器本质上是一个Python函数，它可以让其他函数在不需要做任何代码变动的前提下增加额外功能，装饰器的返回值也是一个函数对象。并且不会改变函数的调用方式。

使用装饰器方法：@具有装饰功能的函数。例如下面的@foo。

有些人说装饰器就是高阶函数+带有闭包特性的嵌套函数，但是我认为没有嵌套函数也可以写出装饰器。

无参数和无嵌套函数装饰器

def foo(func):

    print 'decorator foo'

    return func  

@foo

def bar():

    print 'bar'  

bar()

#没有嵌套函数，增加了打印"decorator foo"功能，并且没有改变函数的调用方式。这个相当于  ①先执行 bar=foo（bar）②再执行bar（）因为bar（）是函数调用所以foo（bar）必须有函数返回值，且是一个可调用的对象

无参装饰器

无参装饰器是指装饰器没有参数

import time

def decorator(func):

        def wrapper(*args,**kwargs):

            start=time.time()

            func(*args,**kwargs)

            stop=time.time()

            print 'run time is %s ' %(stop-start)

            print timeout

        return wrapper

@decorator                 //装饰器

def test(list_test):

    for i in list_test:

        time.sleep(0.1)

        print '-'*20,i

#decorator(test)(range(10))

test(range(10)

#可以看出装饰器decorator并没有参数，装饰器实际上是在函数里内嵌被装饰的函数，但是如果没有内嵌被装饰的函数，那么被装饰的函数就毫无意义。

有参数的装饰器

import time

def timer(timeout=0):

    def decorator(func):

        def wrapper(*args,**kwargs):  #会给被装饰的函数传递参数，因为无法确定装饰器有多少参数，所以使用这个。

            start=time.time()

            func(*args,**kwargs)

            stop=time.time()

            print 'run time is %s ' %(stop-start)

            print timeout

        return wrapper

    return decorator

@timer(2)          #装饰器的参数为2

def test(list_test):

    for i in list_test:

        time.sleep(0.1)

        print '-'*20,i

#timer(timeout=10)(test)(range(10))

test(range(10))

#装饰器timer的参数为2，@timer(2)相当于test=timer(2)(test)

5 生成器

定义：如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？这样就不必创建完整的list，从而节省大量的空间。在Python中，这种一边循环一边计算的机制，称为生成器：generator。

要创建一个generator，有很多种方法。第一种方法很简单，只要把一个列表生成式的[]改成()，就创建了一个generator：

>>> L = [x * x for x in range(10)]

>>> L

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

>>> g = (x * x for x in range(10))

>>> g

<generator object <genexpr> at 0x1022ef630>

如果要一个一个打印出来，可以通过next()函数获得generator的下一个返回值：

>>> next(g)

0

>>> next(g)

1

>>> next(g)

4

>>> next(g)

9

>>> next(g)

16

>>> next(g)

25

>>> next(g)

36

>>> next(g)

49

>>> next(g)

64

>>> next(g)

81

>>> next(g)

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

StopIteration

正确的方法是使用for循环，因为generator也是可迭代对象：

>>> g = (x * x for x in range(10))

>>> for n in g:

...     print(n)

...

函数和generator仅一步之遥。要把fib函数变成generator，只需要把print(b)改为yield b就可以了

def fib(max): #第一步

    n,a,b = 0,0,1

    while n < max:

        #print(b)

        yield  b

        a,b = b,a+b

        n += 1

    return 'done'

#执行

data = fib(10) #第二步

print(data)    #第三步

print(data.__next__())#第四步

print(data.__next__())

print("干点别的事")

print(data.__next__())

print(data.__next__())

print(data.__next__())

print(data.__next__())

print(data.__next__())

#1第一步会定义一个函数

#2第二步会定义一个data对象，但是此时并没有赋值给data

#4第四步__next__()激活生成器，并开始运行生成器函数，遇到yield结束

next()和send()的区别

其实next()和send()在一定意义上作用是相似的，区别是send()可以传递yield表达式的值进去，而next()不能传递特定的值，只能传递None进去。因此，我们可以看做c.next() 和 c.send(None) 作用是一样的。

需要提醒的是，第一次调用时，请使用next()语句或是send(None)，不能使用send发送一个非None的值，否则会出错的，因为没有Python yield语句来接收这个值。

貌似很吊的生成器

#_*_coding:utf-8_*_

__author__ = 'Alex Li'

import time

def consumer(name):

    print("%s 准备吃包子啦!" %name)

    while True:

       baozi = yield

       print("包子[%s]来了,被[%s]吃了!" %(baozi,name))

def producer(name):

    c = consumer('A')

    c2 = consumer('B')

    c.__next__()  //这里其实就是启动一下，装饰器等价于c.send(None)下面这行也是类似

    c2.__next__()

    print("老子开始准备做包子啦!")

    for i in range(10):

        time.sleep(1)

        print("做了2个包子!")

        c.send(i)

        c2.send(i)

producer("alex")

通过生成器实现协程并行运算

next和send源代码

next与send函数，如下:

static PyObject *

gen_iternext(PyGenObject *gen)

{

    return gen_send_ex(gen, NULL, 0);

}

static PyObject *

gen_send(PyGenObject *gen, PyObject *arg)

{

    return gen_send_ex(gen, arg, 0);

}

函数gen_send_ex如下：

static PyObject *

gen_send_ex(PyGenObject *gen, PyObject *arg, int exc)

{

PyThreadState *tstate = PyThreadState_GET();

PyFrameObject *f = gen->gi_frame;

PyObject *result;

if (gen->gi_running) { // 判断生成器是否已经运行

    PyErr_SetString(PyExc_ValueError,

                    "generator already executing");

    return NULL;

}

if (f==NULL || f->f_stacktop == NULL) { // 如果代码块为空或调用栈为空，

//则抛出StopIteration异常

    /* Only set exception if called from send() */

    if (arg && !exc)

        PyErr_SetNone(PyExc_StopIteration);

    return NULL;

}

if (f->f_lasti == -1) { // f_lasti=1 代表首次执行

    if (arg && arg != Py_None) { // 首次执行不允许带有参数

        PyErr_SetString(PyExc_TypeError,

                        "can't send non-None value to a "

                        "just-started generator");

        return NULL;

    }

} else {

    /* Push arg onto the frame's value stack */

    result = arg ? arg : Py_None;

    Py_INCREF(result); // 该参数引用计数+1

    *(f->f_stacktop++) = result; // 参数压栈

}

/* Generators always return to their most recent caller, not

 * necessarily their creator. */

f->f_tstate = tstate;

Py_XINCREF(tstate->frame);

assert(f->f_back == NULL);

f->f_back = tstate->frame;

gen->gi_running = 1; // 修改生成器执行状态

result = PyEval_EvalFrameEx(f, exc); // 执行字节码

gen->gi_running = 0; // 恢复为未执行状态

/* Don't keep the reference to f_back any longer than necessary.  It

 * may keep a chain of frames alive or it could create a reference

 * cycle. */

assert(f->f_back == tstate->frame);

Py_CLEAR(f->f_back);

/* Clear the borrowed reference to the thread state */

f->f_tstate = NULL;

/* If the generator just returned (as opposed to yielding), signal

 * that the generator is exhausted. */

if (result == Py_None && f->f_stacktop == NULL) {

    Py_DECREF(result);

    result = NULL;

    /* Set exception if not called by gen_iternext() */

    if (arg)

        PyErr_SetNone(PyExc_StopIteration);

}

if (!result || f->f_stacktop == NULL) {

    /* generator can't be rerun, so release the frame */

    Py_DECREF(f);

    gen->gi_frame = NULL;

}

return result;

}

6 迭代器

我们已经知道，可以直接作用于for循环的数据类型有以下几种：

一类是集合数据类型，如list、tuple、dict、set、str等；

一类是generator，包括生成器和带yield的generator function。

这些可以直接作用于for循环的对象统称为可迭代对象：Iterable。

可以使用isinstance()判断一个对象是否是Iterable对象：

>>> from collections import Iterable

>>> isinstance([], Iterable)

True

>>> isinstance({}, Iterable)

True

>>> isinstance('abc', Iterable)

True

>>> isinstance((x for x in range(10)), Iterable)

True

>>> isinstance(100, Iterable)

False

可以被next()函数调用并不断返回下一个值的对象称为迭代器：Iterator。

生成器都是Iterator对象，但list、dict、str虽然是Iterable，却不是Iterator。

把list、dict、str等Iterable变成Iterator可以使用iter()函数：

>>> isinstance(iter([]), Iterator)

True

>>> isinstance(iter('abc'), Iterator)

True

你可能会问，为什么list、dict、str等数据类型不是Iterator？

这是因为Python的Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，只能不断通过next()函数实现按需计算下一个数据，所以Iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算。

Iterator甚至可以表示一个无限大的数据流，例如全体自然数。而使用list是永远不可能存储全体自然数的。

小结

凡是可作用于for循环的对象都是Iterable类型；

凡是可作用于next()函数的对象都是Iterator类型，它们表示一个惰性计算的序列；

集合数据类型如list、dict、str等是Iterable但不是Iterator，不过可以通过iter()函数获得一个Iterator对象。

7 json & pickle 模块

用于序列化的两个模块

json，用于字符串和 python数据类型间进行转换
pickle，用于python特有的类型和 python的数据类型间进行转换

Json模块提供了四个功能：dumps、dump、loads、load

pickle模块提供了四个功能：dumps、dump、loads、load

Json模块提供了四个功能：dumps、dump(序列化，存）、loads（反序列化，读）、load

pickle模块提供了四个功能：dumps、dump(序列化，存）、loads（反序列化，读）、load （不仅可以序列化字典，列表...还可以把一个程序，一个类给序列化掉）

import json

#loads  #-->  内部必须是双引号

#dumps --loads  （对现有的一个操作）

s = '{"desc":"invilad-citykey", "status":1002}'

l = [11,22,33,44]  

result = json.loads(s)

print(result,type(result))

result = json.dumps(l)

print(result,type(result))

结果：

{'status': 1002, 'desc': 'invilad-citykey'} <class 'dict'>

[11, 22, 33, 44] <class 'str'>

dump -- load（对文件的一个操作）

s = {"desc":"invilad-citykey", "status":1002}

l = [11,22,33,44]

a = json.dump(s,open("db","w", encoding="utf-8"))

b = json.load(open("db","r", encoding="utf-8"))

print(b, type(b)) 

import json

s = '{"key1":"value1","key2":"value2"}'  # ==> 用json模块将字符串转化成其他数据类型，字符串里出现引号必须用双引号

ret = json.loads(s)  # ==> loads 由字符串转其他数据类型

print(ret,type(ret))

ret = json.load(open('ethan.txt','r')) # ==> 将文档（内部是字符串格式）转换成python的其他数据类型

print(ret,type(ret))  # ==> 文档里是字典样式的字符串

l = '[11,22,3,56,75]'

result =json.loads(l)

print(result,type(result))

# 总结：

# json.loads()用于将形似字典、列表、元组的字符串，转换成字典、列表、元组

# json.load() 用于将文档（内容是形似字典、列表、元组的字符串）转换成字典、列表、元组

di = {"key1":"value1","key2":"value2"}

ret = json.dumps(di) # ==> 将字典、列表、元组 转换成字符串格式

print(ret,type(ret))

json.dump(di,open('ethan.txt','a+'))  # ==> 将字典、元组、列表转换成字符串格式并写入文档

import pickle

d = {'name':'ethan','age':28}

ret = pickle.dumps(d) # ==> pickle将字典、元组、列表转换成二进制

print(ret,type(ret))

l = [11,22,3,45,54]

res = pickle.dumps(l)

print(res)

pickle.dump(d,open('ethan.txt','ab')) # ==> 将字典、元组、列表转换成二进制写入文档

# 注意 dump load 不要一起运行，会报错，一步一步来

f = open('ethan.txt','rb')

r = pickle.loads(f.read()) # ==> 将二进制转换成字典、列表、元组

print(r)

秒客网