一. 生成器的介绍
在介绍生成器(Generator)之前,我们首先需要熟悉列表生成式,列表生成式是Python内置的简单又强大的用来创建列表的生成式。
举个例子,
如果我们想生成[1*1,2*2,3*3,4*4,5*5,6*6,7*7,8*8,9*9]
比较笨的方法是
l = []
for i in range(1,10):
l.append(i*i)
而列表生成式可以用一句语句代替上述的循环语句:
[i*i for i in range(1,10)]
更方便的是我们可以添加条件判断,或者使用多层循环,达成我们想要的结果:
#用if判断来获取偶数的平方
[ i*i for i in range(1,10) if i%2==0 ] #二重循环实现排列组合
[ x + y for x in 'abc' for y in '' ]
言归正传,回到生成器。生成器典型的应用场景是这样的: 假如我们需要生成100万个元素,但是我们需要用到的往往只有几个怎么办?如果用列表生成式全部创建的话,则会浪费大量的空间: 为了需要用到的几个元素,我们创建了100万个元素的列表。
而生成器正是这样可以不必创建完成列表,可以一边循环一边计算出后续元素的机制。
创建生成器的方法很简单,只需要把创建列表生成式时的'[]'改成'()'即可
#List
l = [ i*i for i in range(1,10) if i%2==0 ] #Generator
g = ( i*i for i in range(1,10) if i%2==0 )
生成器的用法:通过next()函数获得下一个生成的值。直到计算到最后一个元素,没有更多的元素时,抛出StopIteration
的错误。
>>> next(g)
4
>>> next(g)
16
>>> next(g)
36
>>> next(g)
64
>>> next(g)
Traceback (most recent call last):
File "<pyshell#73>", line 1, in <module>
next(g)
StopIteration
更科学的方法是使用for
循环,因为generator也是可迭代对象,并且不需要关心StopIteration
的错误。
>>> for i in g:
print(i) 4
16
36
64
当我们的生成器的需要计算的比较复杂,无法通过类似列表生成式的for循环实现时,则需要另外一种实现生成器的方法:在函数中使用'yield'关键字
def fib(max):
n, a, b = 0, 0, 1
while n < max:
yield b
a, b = b, a + b
n = n + 1
return 'Done'
对上述代码有以下几点:
1. 代码的作用是用生成器的方法实现斐波那契数列
2. 函数中使用关键字''yield"之后,函数就不再是普通的函数了,而变成了生成器
3. generator和函数的执行流程不一样。函数是顺序执行,遇到return
语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()
的时候执行,遇到yield
语句返回,再次执行时从上次返回的yield
语句处继续执行。
4. 生成器中可以没有return语句,并不影响生成器的功能。上述代码例子中带的return 'Done',将会在抛出StopIteration
的错误时打印出来。你可以用next()函数触发StopIteration错误试一试。
二. 迭代器和可迭代对象
迭代器:迭代器就是Iterator,意思指可以作用于for
循环,还可以被next()
函数不断调用并返回下一个值,直到最后抛出StopIteration
错误表示无法继续返回下一个值。毫无疑问,我们的生成器就属于迭代器(Iterator)。
可迭代对象:Iterable Object,可以直接作用于for
循环的对象统称为可迭代对象:Iterable Object
。显然,生成器也属于可迭代对象。list, tuple, dict, set, str因为可以直接作用于for循环,所以也是可迭代对象;但是无法被next()函数调用返回下一个值,所以不属于迭代器。
总结: 生成器Generator即是迭代器(Iterator),也是可迭代对象(Iterable Object)。其实从定义上分析,迭代器一定是可迭代对象。
list, tuple, dict, set, str是可迭代对象(Iterable Object),但不是迭代器(Iterator)。