Python进阶【第八篇】迭代器和生成器

时间:2021-07-05 17:35:06

一、何谓迭代

如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们称为迭代(Iteration)。迭代是一个重复的过程,每次重复即一次迭代,并且每次迭代的结果都是下一次迭代的初始值。

l=[1,2,3]
count=0
while count < len(l): #迭代
print(l[count])
count+=1

在Python中,迭代是通过for ... in来完成的,

对于字典这种数据类型,默认情况下,dict迭代的是key。如果要迭代value,可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()。
由于字符串也是可迭代对象,因此,也可以作用于for循环。

即:任何可迭代对象都可以作用于for循环,包括我们自定义的数据类型,只要符合迭代条件,就可以使用for循环。

二、迭代器及迭代器对象

1.什么是迭代器

对于序列类型:字符串、列表、元组,我们可以使用索引的方式迭代取出其包含的元素。但对于字典、集合、文件等类型是没有索引的,若还想取出其内部包含的元素,则必须找出一种不依赖于索引的迭代方式,这就是迭代器。

而可迭代对象指的是内置有__iter__方法的对象,即obj.__iter__,

open('a.txt').__iter__#文件也是一种可迭代对象

可迭代对象执行obj.__iter__()得到的结果就是迭代器对象,

文件类型是迭代器对象
open('a.txt').__iter__()
open('a.txt').__next__()

而迭代器对象指的是既内置有__iter__又内置有__next__方法的对象。简单说,实现了迭代器协议的对象就是可迭代对象。(有点绕,慢慢读就能明白)

l=[]1,2,3]
iter_l=l._iter_()#有iter方法,说明是可迭代对象
print(iter_l._next_())#调用next()方法,得到迭代器对象

2.迭代器对象的使用

dic={'a':1,'b':2,'c':3}
iter_dic=dic.__iter__() #得到迭代器对象,迭代器对象即有__iter__又有__next__,但是:迭代器.__iter__()得到的仍然是迭代器本身
iter_dic.__iter__() is iter_dic #True print(iter_dic.__next__()) #等同于next(iter_dic)
print(iter_dic.__next__()) #等同于next(iter_dic)
print(iter_dic.__next__()) #等同于next(iter_dic)
# print(iter_dic.__next__()) #抛出异常StopIteration,或者说结束标志 #有了迭代器,我们就可以不依赖索引迭代取值了
iter_dic=dic.__iter__()
while 1:
try:
k=next(iter_dic)
print(dic[k])
except StopIteration:
break

next方法,执行该方法要么返回迭代中的下一项,要么引起一个stoplteration异常,以终止迭代,迭代只能往后走,不能往前退。

3.for循环的工作原理

#基于for循环,我们可以完全不再依赖索引去取值了
dic={'a':1,'b':2,'c':3}
for k in dic:
print(dic[k]) #for循环的工作原理
#1:执行in后对象的dic.__iter__()方法,得到一个迭代器对象iter_dic
#2: 执行next(iter_dic),将得到的值赋值给k,然后执行循环体代码
#3: 重复过程2,直到捕捉到异常StopIteration,结束循环

三、生成器

生成器的特征:只要函数内部包含有yield关键字,那么函数名()的到的结果就是生成器,并且不会执行函数内部代码,生成器就是迭代器

与return相比,yield在同一个函数中可以有多个,作为返回值,可以返回多次值,可以挂起/保存函数的运行状态。生成器就是一种数据类型,自动实现了迭代器协议。

def func():
print('====>first')
yield 1
print('====>second')
yield 2
print('====>third')
yield 3
print('====>end') g=func()
print(g) #<generator object func at 0x0000000002184360>

三元表达式

name=input('姓名>>: ')
res='SB' if name == 'alex' else 'NB'
print(res)

主体由三部分组成,主体是if语句,if语句前面是布尔值为真的返回情况,后面是else语句。这就是一个典型的三元表达式,在Python中没有四元表达式。

列表解析式

egg_list=[]
for i in range(10):
egg_list.append('鸡蛋%s' %i) egg_list=['鸡蛋%s' %i for i in range(10)]

把一个三元表达式放到一个列表中,最终结果也得到一个列表,就成了列表解析式。

生成器表达式

#1、把列表推导式的[]换成()就是生成器表达式

#2、示例:生一筐鸡蛋变成给你一只老母鸡,用的时候就下蛋,这也是生成器的特性
>>> chicken=('鸡蛋%s' %i for i in range(5))
>>> chicken
<generator object <genexpr> at 0x10143f200>
>>> next(chicken)
'鸡蛋0'
>>> list(chicken) #因chicken可迭代,因而可以转成列表
['鸡蛋1', '鸡蛋2', '鸡蛋3', '鸡蛋4',] #3、优点:省内存,一次只产生一个值在内存中

列表生成式,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。在Python中,我们可以使用生成器函数,一边循环一边计算,这样就不必创建完整的list,从而节省大量的空间。