数据类型分为可变、不可变。可变对象表示可以原处修改该数据对象,不可变对象表示必须创建新对象来保存修改后的数据。
在基础数据类型中:
- 数值、字符串、元组、frozenset是不可变对象
- 列表、set、dict是可变对象
对于可变对象,比如有一个列表L,查看它的id以及第一个元素的id。
>>> L = ['a', 'b', 'c']
>>> id(L)
23099392
>>> id(L[0])
57027008
这意味着在内存中有一片区域,这片区域存放的数据类型是列表(每个数据对象都有自己的类型声明),列表包含至少3个数据内存块,分别存放了3个字符串类型的数据(实际上是存放了这3个字符对象的地址)。如下图所示:
可变对象(不仅仅是这里的序列、列表)意味着修改该数据对象,不会在内存中新创建另一个内存空间来存放新数据对象。例如,修改这个列表中的第一个元素为"aa"。
>>> L[0]="aa"
>>> L
['aa', 'b', 'c']
>>> id(L)
23099392
发现列表的id并没有改变,也就是列表的内存地址仍然是那一块。这表示列表是可变序列。
但是,如果查看第一个元素的id,会发现已经改变了:
>>> id(L[0])
61863232
这说明,虽然列表的内存地址没有改变,但是列表中的第一个元素的地址已经改变了。实际上,上面修改列表元素后的列表结构变成如下图所示:
也就是说,修改列表中的第一个元素过程中,创建了一个新的内存块来存放新的字符串,原始的那个字符串"a"因为没有被引用了,它将等待垃圾回收器的回收。不管如何,列表的地址一直没变。
为什么修改列表中的元素需要创建新的内存块?这是因为这个元素是字符串,而字符串是不可变对象。
不可变对象意味着,不能在原始内存地址块中修改数据,必须新创建一个地址块来保存修改后的数据对象。正如上面修改字符串"a"为"aa"的结果。
假如列表L中的第一个元素仍然是一个嵌套在L中的列表,因为列表是可变对象,现在修改L的第一个元素,这第一个元素的地址不会改变。
>>> L = [['a'], 'b', 'c']
>>> id(L[0])
23099392
>>> L[0][0] = "aa"
>>> id(L[0])
23099392
这里改变的只有内嵌的列表中第一个元素的地址。
虽然可变对象可以原处修改数据,不会创建新对象,但并不意味着操作可变对象总是不会创建新对象,这取决于对可变对象做什么操作,比如分片操作一定会创建新对象。