super函数没有那么简单-super原理剖析

时间:2023-03-09 05:09:12
super函数没有那么简单-super原理剖析

开始之前,先出一道题:

 #super函数探讨
class A(object):
def __init__(self):
print 'A.__init__' class B(A):
def __init__(self):
super(B, self).__init__()
print 'B.__init__' class C(A):
def __init__(self):
super(C, self).__init__()
print 'C.__init__' class D(B, C):
def __init__(self):
super(D, self).__init__()
print 'D.__init__' d = D()

上面的运行结果是什么?

是下面的结果吗?

A.__init__
B.__init__
D.__init__

正确答案:

A.__init__
C.__init__
B.__init__
D.__init__

有没有疑惑?super()函数不是调用指定类的父类的方法吗!打印了A.__init__下一句为什么是C.__init__呢?

根本原因是:

super 和父类没有实质性的关联

首先,我们知道新式类采用广度优先算法,我们来看一下上面的继承关系:

super函数没有那么简单-super原理剖析

那么,Python是如何实现继承的,继承顺序又是由谁决定的呢? 对于你定义的每一个类而已,Python会计算出一个所谓的方法解析顺序(MRO Method Resolution Order)列表。类的继承顺序就是由这个MRO决定的

MRO通过class.__mro__来查看,我们来打印一下上面例子中的MRO:

print D.__mro__
(<class '__main__.D'>, <class '__main__.B'>, <class '__main__.C'>, <class '__main__.A'>, <type 'object'>)

注意__mro__是类的属性,实例没有该属性

这个MRO列表就是一个简单的所有基类的线性顺序表。为了实现继承,Python会在MRO列表上从左到右开始查找基类,直到找到第一个匹配这个属性的类为止。

而这个MRO列表的构造是通过一个C3线性化算法来实现的。 它实际上就是合并所有父类的MRO列表并遵循如下三条准则:

1)子类会先于父类被检查

2)多个父类会根据它们在列表中的顺序被检查

3)如果对下一个类存在两个合法的选择,选择第一个父类

好像还是没明白为什么例子中,打印了A.__init__下一句为什么是C.__init__呢?

我们使用一个函数来解释一下super的原理:

def super(cls, inst):
mro = inst.__class__.mro()
return mro[mro.index(cls) + 1]

其中,cls 代表类,inst 代表实例,上面的代码做了两件事:

1)获取 inst 的 MRO 列表

2)查找 cls 在当前 MRO 列表中的 index, 并返回它的下一个类,即 mro[index + 1]

当你使用 super(cls, inst) 时,Python 会在 inst 的 MRO 列表上搜索 cls 的下一个类。

是不是有一种豁然开朗的赶脚!让我们回到例子中,这里我画出了整个流程;

super函数没有那么简单-super原理剖析

从上面的流程图就可以看出打印的顺序是对的!

了解了super的原理,那么也就可以理解下面这段有趣的代码了:

1)执行下面代码

 class A(object):
def go(self):
print 'A go'
super(A, self).go() a = A()
a.go()

会报错:

AttributeError: 'super' object has no attribute 'go'

2)执行下面代码:

 class A(object):
def go(self):
print 'A go'
super(A, self).go() class B(object):
def go(self):
print 'B go' class C(A, B):
pass c = C()
c.go()

不会报错,结果为:

A go
B go

充分说明了super 和父类没有实质性的关联

另外,我们想出了super以外,还有一种直接调用父类方法的方法,如下:

 #super函数探讨
class A(object):
def __init__(self):
print 'A.__init__' class B(A):
def __init__(self):
# super(B, self).__init__()
A.__init__(self)
print 'B.__init__' class C(A):
def __init__(self):
# super(C, self).__init__()
A.__init__(self)
print 'C.__init__' class D(B, C):
def __init__(self):
# super(D, self).__init__()
B.__init__(self)
C.__init__(self)
print 'D.__init__' d = D()

为什么不用这种方法呢?我们运行一下,看一下,结果为:

A.__init__
B.__init__
A.__init__
C.__init__
D.__init__

很明显,A的构造函数运行了两次,这不是我们所希望的;所以还是用super吧!