浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器

1.iterable iterator区别

要了解两者区别，先要了解一下迭代器协议：
迭代器协议是指：对象需要提供__next__()方法，它返回迭代中的元素，在没有更多元素后，抛出stopiteration异常，终止迭代。
可迭代对象就是：实现了迭代器协议的对象。
协议是一种约定，可迭代对象实现迭代器协议，python的内置工具(如for循环，sum，min，max函数等)通过迭代器协议访问对象,因此，for循环并不需要知道对象具体是什么，只需要知道对象能够实现迭代器协议即可。
迭代器(iterator)与可迭代对象(iterable)并不是同一个概念。

直观上：

1.可迭代对象(iterable):凡是具有__iter__的方法的类，都是可迭代的类。可迭代类创建的对象实现了__iter__方法，因此就是可迭代对象。用list、tuple等容器创建的对象，都是可迭代对象。可迭代对象通过__iter__方法返回一个迭代器，然后在内部调用__next__方法进行迭代，最后没有元素时，抛出异常(这个异常python自己会处理，不会让开发者看见)。

2.迭代器(iterator):迭代器对象必须同时实现__iter__和__next__方法才是迭代器。对于迭代器来说，__iter__ 返回的是它自身 self，__next__ 则是返回迭代器中的下一个值,最后没有元素时，抛出异常(异常可以被开发者看到)。

从上面2点可以看出：

1.迭代器一定是可迭代对象，因为它实现了__iter__()方法；

2.通过iter()方法(在类的内部就是__iter__)能够使一个可迭代对象返回一个迭代器。

3.迭代器的 __iter__ 方法返回的是自身，并不产生新的迭代器对象。而可迭代对象的 __iter__ 方法通常会返回一个新的迭代器对象。

第3点性质正是可迭代对象可以重复遍历的原因(每次返回一个独立的迭代器，就可以保证不同的迭代过程不会互相影响)；而迭代器由于返回自身，因此只能遍历一次。

上面3点可以通过下面的例子看出来：

				?

									from collections import iterable

									from collections import iterator

									print isinstance(iter([1,2]),iterator)

									print isinstance(iter([1,2]),iterable)

									print isinstance([1,2],iterator)

									print isinstance([1,2],iterable)

									##result

									true

									true

									false

									true

									##id可以查看一个对象在内存中的地址

									test=[1,2,3]

									testiter=iter(test)

									print id(testiter)

									print id(testiter)

									print id(iter(test))

									print id(iter(test))

									print id(test.__iter__())

									print id(test.__iter__())

									##result:可迭代对象每次调用iter方法都会返回一个新的迭代器对象，而迭代器对象调用iter方法返回自身

									67162576

									67162576

									67162688

									67162632

									67162856

									67163024

2.iterable的工作机制

拿一个例子看看，首先定义一个有__iter__方法,但是没有next()方法的类 (ps：在python2中是next()，python3是__next__())：

				?

									from collections import iterable, iterator

									class student(object):

									 def __init__(self,score):

									 self.score=score

									 def __iter__(self):

									 return iter(self.score)

									test= student([80,90,95])

									print isinstance(test, iterable)

									print isinstance(test, iterator)

									for i in test:

									 print i

									##result

									true

									false

									80

									90

									95

									##可重复遍历

									for i in test:

									 print i

									##result

									80

									90

									95

上面代码的结果印证了定义中提到的：

缺少了next()方法，可迭代对象就不是迭代器。

此外，注意到：可迭代对象通过__iter__方法每次都返回了一个独立的迭代器，这样就可以保证不同的迭代过程不会互相影响。

也就是说，通过iterable可以实现重复遍历，而迭代器是无法重复遍历的！

因此，如果想要把可迭代对象转变为迭代器，可以先调用iter()方法返回一个迭代器。然后就可以用next()不断迭代了！

				?

									print isinstance(iter(test),iterator)

									testiter=iter(test)

									print testiter.next()

									print testiter.next()

									print testiter.next()

									##result

									true

									80

									90

									95

									##一旦取完了可迭代对象中所有的元素，再次调用next就会发生异常

									print testiter.next()

									##result

									stopiteration:

3.迭代器iterator的工作机制

看下面这个例子：

				?

									class student(object):

									 def __init__(self,score):

									 self.score=score

									 def __iter__(self):

									 return self

									 def next(self):

									 if self.score<100:

									 self.score+=1

									 return self.score

									 else:

									 raise stopiteration()

									test= student(90)

									print isinstance(test, iterable)

									print isinstance(test, iterator)

									print test.next()

									print test.next()

									print test.next()

									for i in test:

									 print i

									##result

									true

									true

									91

									92

									93

									94

									95

									96

									97

									98

									99

									100

									##如果此时再对test这个迭代器调用next方法，就会抛出异常

									test.next()

									##result

									stopiteration:

这个例子印证了定义中的：迭代器对象必须同时实现__iter__和__next__方法才是迭代器。

那么，使用迭代器好处在哪呢?

python的iterator对象表示的是一个数据流，iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出stopiteration错误。可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，只能不断通过next()函数实现按需计算下一个数据，所以iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算。

一个很常见的应用就是：python在处理列表的时候，是直接把整个列表读进内存的，当遇到大量样本时的时候会变得很慢。而迭代器的优势在于只把需要的元素读进内存，因此占用内存更少。

换句话说，迭代器是一种惰性求值模式，它是有状态的，只有在调用时才返回值，没有调用的时候就等待下一次调用。这样就节省了大量内存空间。

这个例子印证了定义中的：迭代器对象必须同时实现__iter__和__next__方法才是迭代器。

那么，使用迭代器好处在哪呢?

换句话说，迭代器是一种惰性求值模式，它是有状态的，只有在调用时才返回值，没有调用的时候就等待下一次调用。这样就节省了大量内存空间。

4.for循环的工作机制

有了上面2个例子，就可以总结一下在可迭代对象与迭代器中的for循环工作机制了。

当对象本身就是迭代器时，for循环工作机制：

调用 __iter__方法，返回自身self,也就是返回迭代器。
不断地调用迭代器的next()方法，每次按序返回迭代器中的一个值。
迭代到最后没有元素时，就抛出异常 stopiteration

在可迭代对象中，for循环工作机制：

先判断对象是否为可迭代对象(等价于判断有没有__iter__或__getitem__方法)，没有的话直接报错，抛出typeerror异常。有的话，调用 __iter__方法，返回一个迭代器。
在python内部不断地调用迭代器的__next__方法，每次按序返回迭代器中的一个值。
迭代到最后没有元素时，就抛出异常 stopiteration，这个异常 python 自己会处理，不会暴露给开发者。

借用网络上的一张图直观理解一下：

浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器

此外，还要注意，python中的for循环其实兼容了两种机制：

如果对象有__iter__会返回一个迭代器。
如果对象没有__iter__，但是实现了__getitem__，会改用下标迭代的方式。
__getitem__可以帮助一个对象进行取数和切片操作。

当for发现没有__iter__但是有__getitem__的时候，会从0开始依次读取相应的下标，直到发生indexerror为止，这是一种旧的迭代协议。iter方法也会处理这种情况，在不存在__iter__的时候，返回一个下标迭代的iterator对象来代替。一个重要的例子是str，字符串就是没有__iter__方法的，但是却依然可以迭代，原因就是其在for循环时调用了__getitem__方法。

看一个例子：

				?

									from collections import iterable, iterator

									class student(object):

									 def __init__(self,score):

									 self.score=score

									 def __getitem__(self,n):

									 return self.score[n]

									test= student([80,90,95])

									print isinstance(test, iterable)

									print isinstance(test, iterator)

									print isinstance(iter(test), iterable)

									print isinstance(iter(test), iterator)

									for i in test:

									 print i

									##result

									false

									false

									true

									true

									80

									90

									95

									for i in range(0,3):

									 print test[i]

									##result

									80

									90

									95

									for i in iter(test):

									 print i

									##result

									80

									90

									95

可以看到，实现了__getitem__方法的对象本身，尽管不是iterable与iterator，仍旧是可以调用for循环的。
通过iter方法，返回一个下标迭代的iterator对象。

5.generator的原理

最后说一下生成器，生成器是一种特殊的迭代器，当然也是可迭代对象。
对于生成器，python会自动实现迭代器协议，以便应用到迭代中（如for循环，sum函数）。由于生成器自动实现了迭代器协议，所以，我们可以调用它的next方法，并且，在没有值可以返回的时候，生成器自动产生stopiteration异常。
创建生成器的方法：将return 改为yield。具体的实现网络上教程很多，不细说了。

6.总结

到一幅图片很好的描述了本文的所有内容，就拿它作为文末的总结吧！

浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器

以上所述是小编给大家介绍的python中的可迭代对象、迭代器、for循环工作机制、生成器详解整合，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持！

原文链接：https://blog.csdn.net/qq_39345165/article/details/87885649

秒客网

浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器

相关文章