目录结构:
contents structure [-]
在开始文章之前,先贴上一张iterable、iterator与generator之间的关系图:
1. iterator vs iterable
迭代器(iterator)
迭代器是实现了迭代器协议的类对象,迭代器协议规定了迭代器类必需定义__next()__方法。当对迭代器对象调用next()方法时,对象会去调用__next()__计算迭代器的返回值。
可迭代对象(iterable)
可迭代对象可以是任何对象,不一定是能返回迭代器的数据结构。一个可迭代对象会直接或间接性的调用这两个方法__iter()__和__next()__;其中__iter()__方法只能返回迭代器对象,__next()__则供给迭代器进行调用。
通常情况下,可迭代类都会实现__iter()__和__next()__,并且__iter()__返回它自己,换句话说,该类即是迭代器又是可迭代类。
下面的代码展示了迭代器和可迭代器对象之间的差别:
1
2
3
4
5
6
7
8
|
a_set = { 1 , 2 , 3 } #定义set数据类型,set是可迭代类型
b_iterator = iter (a_set) #得到set的迭代器
#output: 1
print ( next (b_iterator))
#output: <class 'set'>
print ( type (a_set))
#output: <class 'set_iterator'>
print ( type (b_iterator))
|
从结果可以看出a_set是一个可迭代类型(set类型),b_iterator是一个迭代器(set_iterator),它们两个是完全不一同的类型。
下面的自定义了一个迭代器:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
class series( object ):
def __init__( self , low, high):
self .current = low
self .high = high
def __iter__( self ):
return self
def __next__( self ):
if self .current > self .high:
raise stopiteration
else :
self .current + = 1
return self .current - 1
n_list = series( 1 , 10 )
print ( list (n_list))
|
从上面的代码可以看出,__iter__返回了迭代器本身。__next__返回迭代器的下一个值,如果没有下一个返回值那么会抛出stopiteration异常。如果没有在合适的位置抛出stopiteration异常结束迭代,那么在某些循环语句中(例如:for loop),将会形成死循环,所以在__next__中必需要在合适位置添加退出语句(抛出stopiterator异常)。
2.itertools 模块
itertools是python的内置模块,其中包含了能够创建迭代器的函数。简而言之,它提供了许多能够与迭代器交互的方法。
下面是我们使用itertools模块中count函数的案例:
1
2
3
4
|
from itertools import count
sequence = count(start = 0 , step = 1 )
while ( next (sequence) < = 10 ):
print ( next (sequence),end = " " )
|
输出:
itertools中的cycle函数可以创建无限迭代器,例如:
1
2
3
4
5
6
|
from itertools import cycle
dessert = cycle([ 'icecream' , 'cake' ])
count = 0
while (count ! = 4 ):
print ( 'q. what do we have for dessert? a: ' + next (dessert))
count + = 1
|
输出:
q. what do we have for dessert? a: icecream
q. what do we have for dessert? a: cake
q. what do we have for dessert? a: icecream
q. what do we have for dessert? a: cake
关于更多itertools模块的使用, 可以 参见python文档 。
3.生成器(generator)
生成器可以说是迭代器的亲兄弟,生成器允许我们像上面那样写迭代器而不用额外定义__iter__()和__next__()方法。
看下面的案例:
1
2
3
4
5
6
7
8
|
def series_generator(low, high):
while low < = high:
yield low
low + = 1
n_list = []
for num in series_generator( 1 , 10 ):
n_list.append(num)
print (n_list)
|
如果一个方法中出现了yield关键字,那么该方法就是一个生成器。生成器中没有return语句,函数的返回值实际上是一个generator。当循环开始执行到yield语句后,low的值会被扩展到要返回的generator中。当下一次循环到达yield语句时,generator会从上一次停止的地方恢复执行,并且将最新的low值添加到generator中。循环一直运行下去,直到low>high退出循环。
生成器支持延迟计算,只有当去取生成器中的值时才会计算。
例如:
1
2
3
4
5
6
7
8
9
10
11
|
def test():
print ( "进入test函数" )
for i in range ( 2 ):
print ( "yield number " ,i)
yield i
if "__main__" = = __name__:
print ( "开始调用test" )
res = test()
print ( "结束调用test" )
next (res)
next (res)
|
输出:
开始调用test
结束调用test
第一次next(res)
进入test函数
yield number 0
第二次next(res)
yield number 1
从结果可以看出,只有使用next调用迭代器时(使用for,while循环也可以),才会去执行迭代器函数中的内容。
python中生成器可以分为生成器函数和生成器表达式,生成器函数和生成器表达式是两种不同的类型。
生成器函数是一个函数体中有yield关键字的,我们上面定义的test就是生成器函数。
生成器表达式的使用比较受限制,一个生成器表达式返回一个生成器。下面是一个使用生成器表达式的案例:
1
2
3
|
squares = (x * x for x in range ( 1 , 10 ))
print ( type (squares))
print ( list (squares))
|
输出:
<class 'generator'>
[1, 4, 9, 16, 25, 36, 49, 64, 81]
生成器的效率是非常高的,生成器可以更好的利用内存和cpu的使用效率,并且通常生成器的代码都比较少,这使用生成器的代码非常好容易理解。应此应该尽量多的在代码中使用生成器
参考文档
https://www.datacamp.com/community/tutorials/python-iterator-tutorial
总结
以上所述是小编给大家介绍的python中的迭代器,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!