垃圾回收机制:
引用计数(缺陷是1,维护引用计数消耗资源,2,循环引用)为主,标记--清除和分代收集为辅
如果一个对象的引用为0,系统就会回收这个对象的内存
1,引用计数+1的情况:
1,对象被创建,a=23
2,对象被引用,b=a
3,对象被作为参数,传入到一个函数中,fun(a)
4,对象被作为一个元素,存储到容器中,list=[a,a]
2,引用计数-1的情况:
1,对象的别名被显示销毁,del a
2,对象的别名被赋予新的对象,a=24
3,一个对象离开它的作用于=域,fun函数执行完毕时,fun中函数局部变量(全局变量不会)
4,对象所在的容器被销毁,或从容器中销毁对象
3,查看一个对象的引用计数:
sys.getrefcount(a)可以查看a对象的引用计数,但是比正常计数大1(因为调用函数的时候传入a,这会让他的引用计数+1)
循环引用导致内存泄漏:
def f2():
while True:
c1=ClassA()
c2=ClassA()
c1.t=c2
c2.t=c1
del c1
del c2
c1,c2的引用都不是0,这两个对象都是可以被销毁的(del),但是由于循环引用,导致垃圾回收机制不会回收他们,所以就会导致内存泄漏。
标记-清除机制:
首先标记对象(垃圾检测),然后清除垃圾(垃圾回收)
首先初始所有对象标记为白色,并确定根节点对象(这些对象是不会被删除),标记它们为黑色(表示对象有效)。将有效对象引用的对象标记为灰色(表示对象可达,但它们所引用的对象还没检查),检查完灰色对象引用的对象后,将灰色标记为黑色。重复直到不存在灰色节点为止。最后剩余白色结点都是需要清除的对象。
回收对象的组织:
链表:通过指针将每个回收对象连接起来,形成了一个链表
一个完整的收集过程:链表建立,确定根节点,垃圾标记,垃圾回收
垃圾回收:
垃圾回收后的对象会放在gc.garbage()列表里面
gc.collect()会返回不可达的对象数目
有三种情况会触发垃圾回收:
1,调用gc.collect()
2,当gc模块的计数器达到阀值的时候
3,程序退出的时候
gc模块:
gc模块提供一个接口给开发者设置垃圾回收的选项。上面说到,采用引用计数的方法管理内存的一个缺陷是循环引用,而gc模块的一个主要功能就是解决循环引用的问题
分代技术:
分代技术是一种典型的以空间换时间的技术,对象存在时间越长,越可能不是垃圾,应该越少去收集。
这样的思想,可以减少标记-清除机制所带来的额外操作。分代就是将回收对象分成数个代,每个代就是一个链表(集合),代进行标记-清除的时间与代内对象存活时间成正比例关系。
python里一共有三代,每个代的阀值表示该代最多容纳对象的个数。默认情况下,当0代超过700,或1,2代超过10,垃圾回收机制将触发。
0代触发将清理所有三代,1代触发会清理1,2代,2代触发后只会清理自己。