对象(Objects)
是python中数据的抽象,python中所有的数据均可以用对象或者是对象之间的关系来表示。每个对象均有标识符(identity)、类型(type)、值(value)
。
- 标识符。对象一旦创建,那么它的标识符就不会改变,可以把标识符看作对象在内存中的地址。is 操作可以用来比较两个对象的标识符,函数id()用来返回对象标识符(python中返回对象在内存中的地址)。
- 类型。对象的类型也是不可变的,对象的类型决定了该对象支持的操作,另外也决定了该对象可能的值。type()函数返回一个对象的类型。
- 值。一些对象的值可以改变,我们叫它可变对象,字典和列表均属于可变对象;值不可改变的对象我们叫它不可变对象,数字、字符串、元组均属于不可变对象。
在python中,不存在所谓的传值调用,一切传递的都是对象的引用,也可以认为是传地址。
可变对象与不可变对象
python在heap中分配的对象分成两类:可变对象和不可变对象。所谓可变对象指的是,对象的内容可变,而不可变对象是指对象的内容不可变。
不可变(immutable)对象:int、字符串(string)、float、数值型(number)、元组(tuple)。
可变(mutable)对象:字典型(dictionary)、列表型(list)。
一、不可变对象
由于Python中的变量存放的是对象引用,所以对于不可变对象而言,尽管对象本身不可变,但变量的对象引用是可变的。
i = 73
i += 2
从上面图示得知,对象73和对象75并没有变化,变化的只是创建了一个新的对象,改变了变量的对象的引用。看看下面的代码,更能体现这一点:
#因为258是int对象,是不可变对象的。所以下面3个id的值都是一样的,最后一句的结果也是为True
#有点奇怪的是为什么在IDLE,和在脚本执行的结果不太一样。所以下面的代码请在脚本中执行。 print(id(258))
a = 258
print(id(a))
b = 258
print(id(b))
print(a is b)
总结一下,不可变对象的优缺点。
优点是:这样可以减少重复的值对内存空间的占用。
缺点是:我要修改这个变量绑定的值,如果内存中没用存在该值的内存块,那么必须重新开辟一块内存,把新地址与变量名绑定。而不是修改变量原来指向的内存块的值,这回给执行效率带来一定的降低。
二、可变对象
其对象的内容是可以变化的。当对象的内容发生变化时,变量的对象引用是不会变化的。如下面的例子:
m=[5,9]
m+=[6]
函数参数
Python函数参数对于可变对象,函数内对参数的改变会影响到原始对象;对于不可变对象,函数内对参数的改变不会影响到原始参数。原因在于:
1、可变对象,参数改变的是可变对象,其内容可以被修改。
2、不可变对象,改变的是函数内变量的指向对象。
有关可变对象和不可变对象的介绍,简单的介绍到这里。
对象的回收机制
python不像C那样需要显式地回收对象占用的空间,python内核中有垃圾回收机制,当一个对象不可达时,就会交由垃圾回收机制处理。
一些对象引用了一些外部资源,例如打开的文件或者窗口。通常我们认为当这些对象被垃圾回收机制回收时,它占用的外部资源即被释放。但是,垃圾回收机制并不一定会回收这些对象,因此这些对象提供了显式的方法(通常是_close()_
)用来释放外部资源。程序中最好使用显式的方法来释放外部资源,一般可以使用 _try...finally_
方便地释放。
对象的类型
对象的类型几乎影响了该对象的所有功能,在某种程度上,对象的标识符也受其类型的影响。
>>> sum = 15
>>> sum_add = 12 + 3
>>> sum is sum_add
True
>>> sum = 15000000
>>> sum_add = 10000000 + 5000000
>>> sum is sum_add
False
>>> sum_add == sum
True
对于不可变对象(这里是int),当我们需要一个新的对象(sum_add = 12 + 3)时,python可能会返回已经存在的某个类型和值都一致的对象(sum)的引用。当然,这里只是可能会返回已经存在的对象,要看python的具体实现。同样是创建新的对象sum_add = 10000000 + 5000000,python并没有把值和类型都一样的sum返回给sum_add。
>>> value = []
>>> value_1 = []
>>> value is value_1
False
>>> value == value
True
>>> value = value_1 = []
>>> value is value_1
True
对于可变对象,当我们需要新的对象时,python一定会为我们新建一个。注意,这里value = value_1 = []
将会创建一个空的列表对象,然后同时返回给value和value_1。
扑朔迷离的不可变对象
首先看下面的代码:看我怎么改变不可变对象的值
>>> mutability = [1, 2, 3, 4]
>>> immutability = (0, mutability, 5)
>>> immutability
(0, [1, 2, 3, 4], 5) #查看可变对象与不可变对象的标识符(内存地址)
>>> id(mutability)
28356200
>>> id(immutability)
28048640 #对可变对象与不可变对象都做一些改变
>>> mutability[2] = "see here!"
>>> immutability
(0, [1, 2, 'see here!', 4], 5) #查看改变后的可变对象与不可变对象的标识符(内存地址)
>>> id(mutability)
28356200
>>> id(immutability)
28048640
这里元组immutability中一个元素为可变对象列表mutability,当我们改变mutability的值时,号称不可变对象的元组的值似乎发生了变化。这又是为什么呢?
回答这个问题前,先总结下上面这段代码发生了什么:不可变对象A包含了一个对可变对象B的引用,可变对象B的值发生改变时,不可变对象A的值似乎会发生改变。
那么,为什么我们仍认为A是不可变对象呢?因为A仍然包含对象B,而B的标识符并没有发生变化,也就是说A的所有元素的标识符并没有发生变化。
看内存的布局是怎样的:
可以看出a是一个list列表类型的对象,它是一个可变对象,所以修改它的值不会创建新的对象。但是b是一个不可变对象,只要修改它的值,就会重新创建对象,注意,这里并没有修改它的值,因为它的所有元素的标识符并没有变化。
再看下面的例子:
>>> a = 2
>>> b = (1, a, 3)
>>> b
(1, 2, 3)
>>> id(a)
23112444
>>> id(b)
27983104 >>> a += 10
>>> b
(1, 2, 3)
>>> id(b[1])
23112444
>>> id(b)
27983104 >>> id(a)
23112324
在执行a+=10之前的内存布局为:
执行完a+=10的指令之后的内存布局为:
这里仅仅是原来的int(2)这个对象的引用数目减1.
在来一个狠的,在上面代码的基础上再来一个:
>>> b
(1, 2, 3) >>> b[1] = 13
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment >>> b[1]
2
通过元组类型的对象b对其中的一个int类型对象赋值,这样的话,因为int是不可变对象,所以会重新申请新的内存,那么同样会引起元组b中的xxx引用变量的改变,那么这样就真正的改变了元组b对象的某个元素的标识符。导致真正的改变了不可变元组对象b,这时就会报错。
修改上面的一些bug:
1. 首先id(a)函数是查看引用变量a所指向的对象的标识符,也就是内存地址。并不是引用变量a的内存地址。
2. 不管是元组还是列表,它们的元素存储的都是某个真实对象的引用,并不存储这个对象,因为python中一切皆对象。
先看一个内存结构,然后在看代码:
>>> a = (1,2,3)
>>> b = [1,2,3]
>>> id(a)
19840616
>>> id(b)
28577384
>>> id(a[0])
20032264
>>> id(b[0])
20032264