Python闭包与延迟绑定

时间:2021-09-18 03:34:00

Python闭包

1.什么是闭包,闭包必须满足以下3个条件:

  • 必须有一个内嵌函数
  • 内嵌函数必须应用外部函数的变量
  • 外部函数的返回值必须是内嵌函数

举个栗子

# 嵌套函数但不是闭包 def nested(): def nst(): print('i am nested func %s' % nested.__name__) nst() # 闭包函数 def closure(): var = 'hello world' # 非全局局部变量 def cloe(): print(var) # 引用var return cloe # 返回内部函数 cl = closure() cl() 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19

2.闭包优点

  • 避免使用全局变量
  • 可以提供部分数据的隐藏
  • 可以提供更优雅的面向对象实现

优点1,2 就不说了,很容易理解,关于第三个,例如当在一个类中实现的方法很少时,或者仅有一个方法时,就可以选择使用闭包。

举个栗子

# 用类实现一个加法的类是这样 class _Add(object): def __init__(self, a, b): self.a = a self.b = b def add(self): return self.a + self.b # 用闭包实现 def _Add(a): def add(b): return a + b return add ad = _Add(1) # 是不是很像类的实例化 print(ad(1)) # out:2 print(ad(2)) # out:3 print(ad(3)) # out:4
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20

闭包的概念差不多就是这样了。


Python 延迟绑定

结合一个题目来说明:

def multipliers(): return [lambda x : i*x for i in range(4)] print [m(2) for m in multipliers()] output: # [6, 6, 6, 6] 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

其实这个题目,可能目的是想输出:[0, 2, 4, 6],如何改进才能输出这个结果呢?

def multipliers(): # 添加了一个默认参数i=i return [lambda x, i=i: i*x for i in range(4)] print [m(2) for m in multipliers()] output: # [0, 2, 4, 6]
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

multipliers就是一个闭包函数了

1.def multipliers(): 2. return [lambda x : i*x for i in range(4)] 3. # multipliers内嵌套一个匿名函数 4. # 该匿名函数引用外部非全局变量 i 5. # 返回该嵌套函数 6.print [m(2) for m in multipliers()]
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

下面来解释为什么输出结果是[6,6,6,6]。

运行代码,代码从第6行开始运行,解释器碰到了一个列表解析,循环取multipliers()函数中的值,而multipliers()函数返回的是一个列表对象,这个列表中有4个元素,每个元素都是一个匿名函数(实际上说是4个匿名函数也不完全准确,其实是4个匿名函数计算后的值,因为后面for i 的循环不光循环了4次,同时提还提供了i的变量引用,等待4次循环结束后,i指向一个值i=3,这个时候,匿名函数才开始引用i=3,计算结果。所以就会出现[6,6,6,6],因为匿名函数中的i并不是立即引用后面循环中的i值的,而是在运行嵌套函数的时候,才会查找i的值,这个特性也就是延迟绑定)

# 为了便于理解,你可以想象下multipliers内部是这样的(这个是伪代码,并不是准确的): def multipliers(): return [lambda x: 3 * x, lambda x: 3 * x, lambda x: 3 * x, lambda x: 3 * x]
  • 1
  • 2
  • 3
  • 4

因为Python解释器,遇到lambda(类似于def),只是定义了一个匿名函数对象,并保存在内存中,只有等到调用这个匿名函数的时候,才会运行内部的表达式,而for i in range(4) 是另外一个表达式,需等待这个表达式运行结束后,才会开始运行lambda 函数,此时的i 指向3,x指向2


那我们来看下,添加了一个i=i,到底发生了什么?

def multipliers(): # 添加了一个默认参数i=i return [lambda x, i=i: i*x for i in range(4)]
  • 1
  • 2
  • 3

添加了一个i=i后,就给匿名函数,添加了一个默认参数,而python函数中的默认参数,是在python 解释器遇到def(i=i)或lambda 关键字时,就必须初始化默认参数,此时for i in range(4),每循环一次,匿名函数的默认参数i,就需要找一次i的引用,i=0时,第一个匿名函数的默认参数值就是0,i=1时,第二个匿名函数的默认参数值就是1,以此类推。

# 为了便于理解,你可以想象下multipliers内部是这样的(这个是伪代码只是为了理解): def multipliers(): return [lambda x,i=0: i*x, lambda x,i=1: i*x, lambda x,i=2: i*x, lambda x,i=3:i*x i=3] # x的引用是2 所以output的结果就是:[0,2,4,6]
  • 1
  • 2
  • 3
  • 4
  • 5

当然你的i=i,也可以改成a=i。

def multipliers(): return [lambda x,a=i: a * x for i in range(4)]
  • 1
  • 2

Python的延迟绑定其实就是只有当运行嵌套函数的时候,才会引用外部变量i,不运行的时候,并不是会去找i的值,这个就是第一个函数,为什么输出的结果是[6,6,6,6]的原因。