当我们拿到一个对象的引用时,如何知道这个对象是什么类型、有哪些方法呢?
使用type()
首先,我们来判断对象类型,使用type()函数:
基本类型都可以用type()判断:
1
2
3
4
5
6
|
>>> type ( 123 )
< type 'int' >
>>> type ( 'str' )
< type 'str' >
>>> type ( None )
< type 'NoneType' >
|
如果一个变量指向函数或者类,也可以用type()判断:
1
2
3
4
|
>>> type ( abs )
< type 'builtin_function_or_method' >
>>> type (a)
< class '__main__.Animal' >
|
但是type()函数返回的是什么类型呢?它返回type类型。如果我们要在if语句中判断,就需要比较两个变量的type类型是否相同:
1
2
3
4
5
6
|
>>> type ( 123 ) = = type ( 456 )
True
>>> type ( 'abc' ) = = type ( '123' )
True
>>> type ( 'abc' ) = = type ( 123 )
False
|
但是这种写法太麻烦,Python把每种type类型都定义好了常量,放在types模块里,使用之前,需要先导入:
1
2
3
4
5
6
7
8
9
|
>>> import types
>>> type ( 'abc' ) = = types.StringType
True
>>> type (u 'abc' ) = = types.UnicodeType
True
>>> type ([]) = = types.ListType
True
>>> type ( str ) = = types.TypeType
True
|
最后注意到有一种类型就叫TypeType,所有类型本身的类型就是TypeType,比如:
1
2
|
>>> type ( int ) = = type ( str ) = = types.TypeType
True
|
使用isinstance()
对于class的继承关系来说,使用type()就很不方便。我们要判断class的类型,可以使用isinstance()函数。
我们回顾上次的例子,如果继承关系是:
那么,isinstance()就可以告诉我们,一个对象是否是某种类型。先创建3种类型的对象:
1
2
3
|
>>> a = Animal()
>>> d = Dog()
>>> h = Husky()
|
然后,判断:
1
2
|
>>> isinstance (h, Husky)
True
|
没有问题,因为h变量指向的就是Husky对象。
再判断:
1
2
|
>>> isinstance (h, Dog)
True
|
h虽然自身是Husky类型,但由于Husky是从Dog继承下来的,所以,h也还是Dog类型。换句话说,isinstance()判断的是一个对象是否是该类型本身,或者位于该类型的父继承链上。
因此,我们可以确信,h还是Animal类型:
1
2
|
>>> isinstance (h, Animal)
True
|
同理,实际类型是Dog的d也是Animal类型:
1
2
|
>>> isinstance (d, Dog) and isinstance (d, Animal)
True
|
但是,d不是Husky类型:
能用type()判断的基本类型也可以用isinstance()判断:
1
2
3
4
5
6
|
>>> isinstance ( 'a' , str )
True
>>> isinstance (u 'a' , unicode )
True
>>> isinstance ( 'a' , unicode )
False
|
并且还可以判断一个变量是否是某些类型中的一种,比如下面的代码就可以判断是否是str或者unicode:
1
2
3
4
|
>>> isinstance ( 'a' , ( str , unicode ))
True
>>> isinstance (u 'a' , ( str , unicode ))
True
|
由于str和unicode都是从basestring继承下来的,所以,还可以把上面的代码简化为:
1
2
|
>>> isinstance (u 'a' , basestring )
True
|
使用dir()
如果要获得一个对象的所有属性和方法,可以使用dir()函数,它返回一个包含字符串的list,比如,获得一个str对象的所有属性和方法:
1
2
|
>>> dir ( 'ABC' )
[ '__add__' , '__class__' , '__contains__' , '__delattr__' , '__doc__' , '__eq__' , '__format__' , '__ge__' , '__getattribute__' , '__getitem__' , '__getnewargs__' , '__getslice__' , '__gt__' , '__hash__' , '__init__' , '__le__' , '__len__' , '__lt__' , '__mod__' , '__mul__' , '__ne__' , '__new__' , '__reduce__' , '__reduce_ex__' , '__repr__' , '__rmod__' , '__rmul__' , '__setattr__' , '__sizeof__' , '__str__' , '__subclasshook__' , '_formatter_field_name_split' , '_formatter_parser' , 'capitalize' , 'center' , 'count' , 'decode' , 'encode' , 'endswith' , 'expandtabs' , 'find' , 'format' , 'index' , 'isalnum' , 'isalpha' , 'isdigit' , 'islower' , 'isspace' , 'istitle' , 'isupper' , 'join' , 'ljust' , 'lower' , 'lstrip' , 'partition' , 'replace' , 'rfind' , 'rindex' , 'rjust' , 'rpartition' , 'rsplit' , 'rstrip' , 'split' , 'splitlines' , 'startswith' , 'strip' , 'swapcase' , 'title' , 'translate' , 'upper' , 'zfill' ]
|
类似__xxx__的属性和方法在Python中都是有特殊用途的,比如__len__方法返回长度。在Python中,如果你调用len()函数试图获取一个对象的长度,实际上,在len()函数内部,它自动去调用该对象的__len__()方法,所以,下面的代码是等价的:
1
2
3
4
|
>>> len ( 'ABC' )
3
>>> 'ABC' .__len__()
3
|
我们自己写的类,如果也想用len(myObj)的话,就自己写一个__len__()方法:
1
2
3
4
5
6
7
|
>>> class MyObject( object ):
... def __len__( self ):
... return 100
...
>>> obj = MyObject()
>>> len (obj)
100
|
剩下的都是普通属性或方法,比如lower()返回小写的字符串:
1
2
|
>>> 'ABC' .lower()
'abc'
|
仅仅把属性和方法列出来是不够的,配合getattr()、setattr()以及hasattr(),我们可以直接操作一个对象的状态:
1
2
3
4
5
6
7
|
>>> class MyObject( object ):
... def __init__( self ):
... self .x = 9
... def power( self ):
... return self .x * self .x
...
>>> obj = MyObject()
|
紧接着,可以测试该对象的属性:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
>>> hasattr (obj, 'x' ) # 有属性'x'吗?
True
>>> obj.x
9
>>> hasattr (obj, 'y' ) # 有属性'y'吗?
False
>>> setattr (obj, 'y' , 19 ) # 设置一个属性'y'
>>> hasattr (obj, 'y' ) # 有属性'y'吗?
True
>>> getattr (obj, 'y' ) # 获取属性'y'
19
>>> obj.y # 获取属性'y'
19
|
如果试图获取不存在的属性,会抛出AttributeError的错误:
可以传入一个default参数,如果属性不存在,就返回默认值:
1
2
|
>>> getattr (obj, 'z' , 404 ) # 获取属性'z',如果不存在,返回默认值404
404
|
也可以获得对象的方法:
1
2
3
4
5
6
7
8
9
|
>>> hasattr (obj, 'power' ) # 有属性'power'吗?
True
>>> getattr (obj, 'power' ) # 获取属性'power'
<bound method MyObject.power of <__main__.MyObject object at 0x108ca35d0 >>
>>> fn = getattr (obj, 'power' ) # 获取属性'power'并赋值到变量fn
>>> fn # fn指向obj.power
<bound method MyObject.power of <__main__.MyObject object at 0x108ca35d0 >>
>>> fn() # 调用fn()与调用obj.power()是一样的
81
|
小结
通过内置的一系列函数,我们可以对任意一个Python对象进行剖析,拿到其内部的数据。要注意的是,只有在不知道对象信息的时候,我们才会去获取对象信息。如果可以直接写:
1
|
sum = obj.x + obj.y
|
就不要写:
1
|
sum = getattr (obj, 'x' ) + getattr (obj, 'y' )
|
一个正确的用法的例子如下:
1
2
3
4
|
def readImage(fp):
if hasattr (fp, 'read' ):
return readData(fp)
return None
|
假设我们希望从文件流fp中读取图像,我们首先要判断该fp对象是否存在read方法,如果存在,则该对象是一个流,如果不存在,则无法读取。hasattr()就派上了用场。
请注意,在Python这类动态语言中,有read()方法,不代表该fp对象就是一个文件流,它也可能是网络流,也可能是内存中的一个字节流,但只要read()方法返回的是有效的图像数据,就不影响读取图像的功能。