Python一切皆对象

时间:2021-09-22 14:24:06

Python从设计之初就是一门面向对象的语言,它有一个重要的概念,即一切皆对象。

Java虽然也是面向对象编程的语言,但是血统没有Python纯正。比如Java的八种基本数据类型之一int,在持久化的时候,就需要包装成Integer类对象。但是在python中,一切皆对象。数字、字符串、元组、列表、字典、函数、方法、类、模块等等都是对象,包括你的代码。


对象的概念

究竟何谓对象?不同的编程语言以不同的方式定义“对象”。某些语言中,它意味着所有对象必须有属性和方法;另一些语言中,它意味着所有的对象都可以子类化。

在Python中,定义是松散的,某些对象既没有属性也没有方法,而且不是所有的对象都可以子类化。但是Python的万物皆对象从感性上可以解释为:Python 中的一切都可以赋值给变量或者作为参数传递给函数。

Python 的所有对象都有三个特性:

  • 身份:每个对象都有一个唯一的身份标识自己,任何对象的身份都可以使用内建函数 id() 来得到,可以简单的认为这个值是该对象的内存地址。
>>> a = 1
>>> id(a)
>>> 26188904 # 身份由这样一串类似的数字表示

  • 类型:对象的类型决定了对象可以保存什么类型的值,有哪些属性和方法,可以进行哪些操作,遵循怎样的规则。可以使用内建函数 type() 来查看对象的类型。
>>> type(a)
<type 'int'>
>>> type(type)
<type 'type'> #万物皆对象,type 也是一种特殊的对象 type
  • 值:对象所表示的数据
>>> a
1

"身份"、"类型"和"值"在所有对象创建时被赋值。如果对象支持更新操作,则它的值是可变的,否则为只读(数字、字符串、元组等均不可变)。只要对象还存在,这三个特性就一直存在。

对象的属性:大部分 Python 对象有属性、值或方法,使用句点(.)标记法来访问属性。最常见的属性是函数和方法,一些 Python 对象也有数据属性,如:类、模块、文件等


对象的创建和引用

>>> a = 3

简单来看,上边的代码执行了以下操作:

  • 创建了一个对象来代表数字 3
  • 如果变量 a 不存在,创建一个新的变量 a
  • 将变量 a 和数字 3 进行连接,即 a 成为对象 3 的一个引用,从内部来看,变量是到对象的内存空间的一个指针,尤其注意:变量总是连接到对象,而不会连接到其他变量。

从概念上可以这样理解,对象是堆上分配的一个内存空间,用来表示对象所代表的值;变量是一个系统创建的表中的元素,拥有指向对象的引用;引用是从变量到对象的指针。

从技术上来说,每一个对象有两个标准的头部信息,一个类型标识符来标识类型,还有一个引用的计数器,用于决定是否需要对对象进行回收。这里还涉及到对象的一种优化方法,Python 缓存了某些不变的对象对其进行复用,而不是每次创建新的对象。

>>> a = 1
>>> b = 1
>>> id(a)
26188904
>>> id(b)
26188904 # a 和 b 都指向了同一对象

共享引用

在 Python 中变量都是指向某一对象的引用,当多个变量都引用了相同的对象,成为共享引用。

>>> a = 1
>>> b = a
>>> a = 2
>>> b
1 # 由于变量仅是对对象的一个引用,因此改变 a 并不会导致 b 的变化

但对于像列表这种可变对象来说则不同

>>> a = [1, 2, 3]
>>> b = a
>>> a[0] = 0
>>> a
[0, 2, 3] # 这里并没有改变 a 的引用,而是改变了被引用对象的某个元素
>>> b
[0, 2, 3] # 由于被引用对象发生了变化,因此 b 对应的值也发生了改变

由于列表的这种可变性,在代码执行某些操作时可能出现一些意外,因此需要对其进行拷贝来保持原来的列表

>>> a = [1, 2, 3]
>>> b = a[:]
>>> id(a)
140200275166560
>>> id(b)
140200275238712 # 由于 b 引用的是 a 引用对象的一个拷贝,两个变量指向的内存空间不同
>>> a[0] = 0
>>> b
[1, 2, 3] # 改变 a 中的元素并不会引起 b 的变化

对于字典和集合等没有分片概念的类型来说,可以使用 copy 模块中的 copy() 方法进行拷贝

>>> import copy
>>> b = copy.copy(a)

对象相等

== 操作符用于测试两个被引用的对象的值是否相等

is 用于比较两个被引用的对象是否是同一个对象

>>> a = [1, 2, 3]
>>> b = a
>>> a is b
True # a 和 b 指向相同的对象
>>> a = [1, 2, 3]
>>> b = [1, 2, 3]
>>> a is b
False # a 和 b 指向不同的对象

当操作对象为一个较小的数字或较短的字符串时,又有不同:

>>> a = 7
>>> b = 7
>>> a is b
True # a 和 b 指向相同的对象

这是由于 Python 的缓存机制造成的,小的数字和字符串被缓存并复用,所以 a 和 b 指向同一个对象


对象回收机制

上边提到对象包含一个引用的计数器,计数器记录了当前指向该对象引用的数目,一旦对象的计数器为 0 ,即不存在对该对象的引用,则这个对象的内存空间会被回收。这就是 Python 中对象的回收机制,一个最明显的好处即在编写代码过程中不需要考虑释放内存空间。

可以通过 sys 模块中的 getrefcount() 函数查询一个对象计数器的值

>>> import sys
>>> sys.getrefcount(1)
718