super函数没有那么简单-super原理剖析

开始之前，先出一道题：

 #super函数探讨

 class A(object):

     def __init__(self):

         print 'A.__init__'  

 class B(A):

     def __init__(self):

         super(B, self).__init__()

         print 'B.__init__'  

 class C(A):

     def __init__(self):

         super(C, self).__init__()

         print 'C.__init__'  

 class D(B, C):

     def __init__(self):

         super(D, self).__init__()

         print 'D.__init__'  

 d = D()

上面的运行结果是什么？

是下面的结果吗？

A.__init__

B.__init__

D.__init__

正确答案：

A.__init__

C.__init__

B.__init__

D.__init__

有没有疑惑？super()函数不是调用指定类的父类的方法吗！打印了A.__init__下一句为什么是C.__init__呢？

根本原因是：

super 和父类没有实质性的关联

首先，我们知道新式类采用广度优先算法，我们来看一下上面的继承关系：

super函数没有那么简单-super原理剖析

那么，Python是如何实现继承的，继承顺序又是由谁决定的呢？对于你定义的每一个类而已，Python会计算出一个所谓的方法解析顺序(MRO Method Resolution Order)列表。类的继承顺序就是由这个MRO决定的。

MRO通过class.__mro__来查看，我们来打印一下上面例子中的MRO：

print D.__mro__

(<class '__main__.D'>, <class '__main__.B'>, <class '__main__.C'>, <class '__main__.A'>, <type 'object'>)

注意__mro__是类的属性，实例没有该属性

这个MRO列表就是一个简单的所有基类的线性顺序表。为了实现继承，Python会在MRO列表上从左到右开始查找基类，直到找到第一个匹配这个属性的类为止。

而这个MRO列表的构造是通过一个C3线性化算法来实现的。它实际上就是合并所有父类的MRO列表并遵循如下三条准则：

1）子类会先于父类被检查

2）多个父类会根据它们在列表中的顺序被检查

3）如果对下一个类存在两个合法的选择，选择第一个父类

好像还是没明白为什么例子中，打印了A.__init__下一句为什么是C.__init__呢？

我们使用一个函数来解释一下super的原理：

def super(cls, inst):

    mro = inst.__class__.mro()

    return mro[mro.index(cls) + 1]

其中，cls 代表类，inst 代表实例，上面的代码做了两件事：

1）获取 inst 的 MRO 列表

2）查找 cls 在当前 MRO 列表中的 index, 并返回它的下一个类，即 mro[index + 1]

当你使用 super(cls, inst) 时，Python 会在 inst 的 MRO 列表上搜索 cls 的下一个类。

是不是有一种豁然开朗的赶脚！让我们回到例子中，这里我画出了整个流程；

super函数没有那么简单-super原理剖析

从上面的流程图就可以看出打印的顺序是对的！

了解了super的原理，那么也就可以理解下面这段有趣的代码了：

1）执行下面代码

 class A(object):

     def go(self):

         print 'A go'

         super(A, self).go()

 a = A()

 a.go()

会报错：

AttributeError: 'super' object has no attribute 'go'

2）执行下面代码：

 class A(object):

     def go(self):

         print 'A go'

         super(A, self).go()

 class B(object):

     def go(self):

         print 'B go'

 class C(A, B):

     pass

 c = C()

 c.go()

不会报错，结果为：

A go

B go

充分说明了super 和父类没有实质性的关联

另外，我们想出了super以外，还有一种直接调用父类方法的方法，如下：

 #super函数探讨

 class A(object):

     def __init__(self):

         print 'A.__init__'

 class B(A):

     def __init__(self):

         # super(B, self).__init__()

         A.__init__(self)

         print 'B.__init__'

 class C(A):

     def __init__(self):

         # super(C, self).__init__()

         A.__init__(self)

         print 'C.__init__'

 class D(B, C):

     def __init__(self):

         # super(D, self).__init__()

         B.__init__(self)

         C.__init__(self)

         print 'D.__init__'

 d = D()

为什么不用这种方法呢？我们运行一下，看一下，结果为：

A.__init__

B.__init__

A.__init__

C.__init__

D.__init__

很明显，A的构造函数运行了两次，这不是我们所希望的；所以还是用super吧！