python 学习笔记

运算符重载

PYTHON-进阶-魔术方法小结(方法运算符重载)

python有着像C++相似的运算符重载，只需要在类中重写__add__、sub 等方法，就可以直接对对象进行 + - 等操作，就好像内置对象一样。也可以重写__getattr__、__setattr__等方法来操作属性，init、del、str 、len__等基本方法都可以重载，比较符的重载包括__cmp、lt、gt__等，以及__getitem、__setitem__等操作索引的方法。总之，完全可以通过重载将一个类写的python之父都不认得。

coroutine

传统我们实现消费者生产者模型都是需要通过多线程之间互相协作，一个线程生产，一个线程消费。协程就是将多线程的事情在一个线程里面干了。传统我们一个函数总是一个入口，一个出口，很明确。协程就是允许一个子程序内部可以中断，然后执行其他子程序，在适当的时候再返回来继续执行，即使在while True这样的函数。这样的话我们就可以生产后就调用消费者，然后消费后再继续生产。

python 2.x中实现协程的方式是通过generator，yield 停止一个子程序后，可以通过send(xxx) 继续执行

协程的好处：

极高的效率，不需要操作系统切换线程，只是程序内部控制

因为协程是一个线程执行，那怎么利用多核CPU呢？最简单的方法是多进程+协程，既充分利用多核，又充分发挥协程的高效率，可获得极高的性能。

而且也不需要多线程的锁机制。。。因为这根本就只有一个线程嘛
通过协程也可以将一个复杂的程序分成多个相互协作的子程序，就好像unix 的管道一样，read ---> grep ---> print 这样，程序会更简单明了，复用性更高

# 简洁高效的生产消费模式

# 装饰器, 用来自动启动协程

def coroutine(func):

    def go(*args, **kwargs):

        g = func(*args, **kwargs)

        g.send(None)

        return g

    return go

@coroutine

def consumer():

    r = ''

    while True:

        n = yield r

        if not n:

            return

        print ('consume {}'.format(n))

        time.sleep(1)

        r = '200 OK'

def producer(target):

    while True:

        n = random.randint(1, 100)

        print ('produce {}'.format(n))

        r = target.send(n)

        print ('consumer return {}'.format(r))

if __name__ == '__main__':

    producer(consumer())

generator

generator 跟普通的方法差不多，只是可以通过yield返回多个值，如下

def gen():

    yield 1

    yield 2

g = gen()

print g # 输出<generator object gen at 0x00000000026BCFC0>

print g.next() # 输出1

print g.next() # 输出2

print g.next() # StopIteration 异常

通过dir(g) 可以看到generator 实现了__iter__ 和 next 方法，所以generator 也是一个迭代器，生成器可以用来简化迭代器的实现

# 简化版的小写字母生成器，相对自定义迭代器来说，真的简单多了

def lower_letters():

    current = 'a'

    while current <= 'z':

        yield current

        current = chr(ord(current) + 1)

for letter in lower_letters():

    print letter

iterator & iterable

python 中的for in语法，可以遍历iterable 对象，例如list，array，map等，其实就是用iter()构造了一个iterator，并捕获StopIteration异常

_iter = iter(iterableObj)

while True:

    try:

        x = _iter.next()

    except StopIteration:

        break

    do_your_func(x)

iterator 和 iterable 本质上的区别是 iterator 实现了__next__(python2.x 是next)和 iter__方法，而iterable只实现了__iter__方法，通过dir([1,2]) 可以看到数组中只实现了__iter ，只是iterable对象

所以，我们可以自定义一个迭代器，只要实现了__next__ 和 iter，并且__next__ 抛出StopIteration异常

class UpperLetter(object):

    def __init__(self):

        self.current = 'A'

    def next(self):

        if self.current > 'Z':

            raise StopIteration()

        result = self.current

        self.current = chr(ord(self.current) + 1)

        return result

    def __iter__(self):

        return self

letters = UpperLetter()

# 自定义的迭代器可以通过for in遍历哦

for letter in letters:

    print (letter)

下划线

方法前后双下划线

约定这是python中的特殊方法，通常你将覆盖这些方法，实现所需的功能，例如__init__

方法前单下划线

约定这是私有方法，外部不能访问。

对于解释器来说， from <模块/包名> import * 是无法导入以_开头的方法

拷贝

python都对象之间赋值都是拷贝引用，如果要拷贝对象，需要使用copy模块

copy.copy 浅拷贝只拷贝父对象，不会拷贝对象的内部的子对象。
copy.deepcopy 深拷贝拷贝对象及其子对象

userInfo = {

    "resultCode": 0,

    "users": {

        'name': "jobs"

    }

}

a = userInfo

b = copy.copy(userInfo)

c = copy.deepcopy(userInfo)

# 修改原来的对象

userInfo['resultCode'] = 1

userInfo['users']['name'] = 'ryan'

print a

print b

print c

# 输出：

# {'resultCode': 1, 'users': {'name': 'ryan'}}

# {'resultCode': 0, 'users': {'name': 'ryan'}}

# {'resultCode': 0, 'users': {'name': 'jobs'}}

可以看到，传引用的全改了，浅拷贝的话子对象还是保留着原来的引用，所以子对象跟着改了，深拷贝岿然不动！

切片

切片是python一个很有趣的语法糖，提供了简洁的方法来取一个数组的一部分

L=[1, 2, 3,4,5]

print L[1: 3] # 取索引1到索引3，不包含索引3

print L[:] # 第一个参数不填表示第一位，最后一个参数不填表示取最后一位

print L[-2:] # 负数表示倒数第n个元素

print L[::2] # 最后一个参数表示隔几个取一次，跟range类似

# 输出

# [2, 3]

# [1, 2, 3, 4, 5]

# [4, 5]

# [1, 3, 5]

# 优雅地将数组 进行分组操作，这里如果i + 3大于数组len, 切片也能自动切到最后一截哈哈

for i in range(0, len(L), 3):

    print L[i: i+3]

# 输出

# [1, 2, 3]

# [4, 5]

闭包

定义

父函数中返回的函数引用了父函数中的参数或者局部变量，这个函数就称为闭包。因此，闭包也是携带状态的函数，并且它的状态可以对外隐藏起来。闭包之于父函数就好像实例之于类

闭包修改外部变量？

一般来说闭包不能修改外部变量，因为对于同名变量的修改 python 把它看做了子函数中的局部变量，所以你直接修改会返回UnboundLocalError: local variable 'm' referenced before assignment错误（据说在python3中可以用nolocal 声明外部变量即可修改）

闭包实现的原理

闭包函数相对于普通函数多出了一个__closure__属性，这是一个元组，这个元祖里面包含了所有闭包函数中引用到的外部变量

参考：

说说 Python 中的闭包

装饰器

装饰器就是一种特殊的闭包，通过传递一个待修饰的函数给修饰函数，并返回一个修饰后的函数，可以用@decoratorFunc 来简化语法，装饰器的作用就是为已经存在的函数或对象添加额外的功能

参考：

Python 的闭包和装饰器：https://segmentfault.com/a/1190000004461404

详解 Python 的装饰器

列表生成式/字典生成式(简洁美观)

[ x * x for x in list] & { x[a] : x[b] for x in list}

python 变量作用域

python的作用域是一层一层向外查的，但是如果在内层想要改变外层的变量，就需要声明global，否则只是相当于定义了一个覆盖全局的局部变量，如下

var = 1

def func1():

    # 此处声明 global var 解决

    var = var + 1

    return var

print func1()

# 报错UnboundLocalError: local variable 'var' referenced before assignment

# 因为我们企图在内层改变外层的var，所以python就把他当做局部变量了，那很明显，这个var在局部并没有赋值

同样的，对于闭包，也是尽量不要在闭包中修改外部函数的变量，理由同上（可以声明nonlocal）
除了def/class/lambda之外，其他如：if/else try/except for/while并不能改变其作用域. 略坑啊，定义在这些东西里面的变量，外部是可以访问的。。。

with as 字句

用with as 字句代替之前的try .... finally fs.close()之类的语句方便了很多

tuple

tuple 就是不可变的list, 用(1, 2, 3)定义

**如果要定义只有一个元素的tuple，不能定义为(1)，python把他当做数字1（括号运算），正确的写法为(1, )

参数

默认参数的坑

python 的默认参数如果为数组的话，要千万小心了

def func2(array=[]):

    array.append("haha")

    print array

func2()  # 输出 ['haha']

func2()  # 输出 ['haha', 'haha']

为什么每次调用的结果都不一样? 因为默认参数的值在函数定义的时候就生成好了，所以当默认参数指向的是可变对象如list

就会改变它的值，所以**默认参数一定要是不可变对象""，如str，int等

可变参数

要往可变参数中传入一个数组，有两种方法

def func3(*arr):

    for i in arr:

        print i

nums = [1, 2, 3]

func3(nums[0], nums[1], nums[2])  # 不得不说，这种写法巨丑

func3(*nums)  # 好看

关键字参数

可变参数在方法中就是一个tuple，而关键字参数在方法中就是一个dict，它可以扩展函数的功能，让用户自定义配置，例如sqlalchemy的create_engine(*args, **kwargs)就使我们可以根据需要定义encoding，echo等参数

同样的，要传入一个dict给可变参数的方法可以用**dict

星解

星解提供了一个很艺术化的方法来unpack一个list或dict

def test(x, y, z):

    print(x, y, z)

testDict = {'x': 1, 'y': 2, 'z': 3}

testList = [10, 20, 30]

test(*testDict)

test(*testList)

#1-> x y z

#2-> 10 20 30

秒客网

python 随笔