今天主要学习关于python 的dict(全称dictionary)和set。dict的用法跟javascript 中map表类似,key + value结构语言。而set,准确来说,只是key的集合。
Dict
直接贴代码
>>> d = {'zhangsan': 95, 'lixi': 75, 'wuliu': 85}
>>> d['zhangsan']
95
dict插入
>>>d['wangba'] = 90 //直接插入wangba该学员的成绩,再次打印d
>>>d
{'lixi': 45, 'wangba': 90, 'zhangsan': 95, 'wuliu': 76}
PS:dict 是一个无序的集合,上面的例子,你插入了一条记录,但是打印出来的顺序是无序的。
学过javascript知道,map中key只能对应一个唯一value,所以,多次对一个key放入value,后面的值会把前面的值冲掉:
>>> d['wangba'] = 88
>>> d['wangba']
88
>>> d['wangba'] = 66
>>> d['wangba']
66
如果key不存在,dict就会报错:
>>> d['liuhai']
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'c'
要避免key不存在的错误,有两种办法,一是通过in
判断key是否存在:
>>>'liuhai' in d
False
二是通过dict提供的get方法,如果key不存在,可以返回None,或者自己指定的value:
>>> d.get('liuhai')
//空,不显示结果
>>> d.get('liuhai', -1)
-1
注意:返回None
的时候Python的交互式命令行不显示结果。
Key删除
要删除一个key,用pop(key)
方法,对应的value也会从dict中删除:
>>> d.pop('wangba')
90
>>> d
{'lixi': 45, 'zhangsan': 95, 'wuliu': 76}
再次提醒,dict内部存放的顺序和key放入的顺序是没有关系的,是一个无序的集合。
和list比较,dict有以下几个特点:
- 查找和插入的速度极快,不会随着key的增加而变慢;
- 需要占用大量的内存,内存浪费多。
而list相反:
- 查找和插入的时间随着元素的增加而增加;
- 占用空间小,浪费内存很少。
所以,dict是用空间来换取时间的一种方法。
dict可以用在需要高速查找的很多地方,在Python代码中几乎无处不在,正确使用dict非常重要,需要牢记的第一条就是dict的key必须是不可变对象。
这是因为dict根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。这个通过key计算位置的算法称为哈希算法(Hash)。
要保证hash的正确性,作为key的对象就不能变。在Python中,字符串、整数等都是不可变的,因此,可以放心地作为key。而list是可变的,就不能作为key:
>>> key = [1, 2, 3]
>>> d[key] = 'a list'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'
Set
set相对与dict来讲,就是只存储key,不存储value。
直接贴代码:
>>>s = set([1,2,3])
>>>s
>>>set([1,2,3])
set 插入key:
>>>s.add(4)
>>>s
set([1, 2, 3, 4])
如果set插入重复的key:
>>> s.add(2)//key 重复的会被处理,不能出现重复的key
>>> s
set([1,2, 3, 4])
set 移除key:
>>> s.remove(1)
>>> s
set([2, 3, 4])
PS:set的特点跟dict类似,都是无序的集合,key都是不可变的,同样list不能作为key。
上面我们一直将python整数和字符串指向的内容是不可变的。何为内容不可变?看下面的例子,从网上摘抄:
>>> a = 'abc'
>>> a.replace('a', 'A')
'Abc'
>>> a
'abc'
虽然字符串有个replace()
方法,也确实变出了'Abc'
,但变量a
最后仍是'abc'
,应该怎么理解呢?
我们先把代码改成下面这样:
>>> a = 'abc'
>>> b = a.replace('a', 'A')
>>> b
'Abc'
>>> a
'abc'
要始终牢记的是,a
是变量,而'abc'
才是字符串对象!有些时候,我们经常说,对象a
的内容是'abc'
,但其实是指,a
本身是一个变量,它指向的对象的内容才是'abc'
。
当我们调用a.replace('a', 'A')
时,实际上调用方法replace
是作用在字符串对象'abc'
上的,而这个方法虽然名字叫replace
,但却没有改变字符串'abc'
的内容。相反,replace
方法创建了一个新字符串'Abc'
并返回,如果我们用变量b
指向该新字符串,就容易理解了,变量a
仍指向原有的字符串'abc'
,但变量b
却指向新字符串'Abc'
了。
所以,python对于不变对象来说,调用对象自身的任意方法,也不会改变该对象自身的内容。相反,这些方法会创建新的对象并返回。
这样,就保证了不可变对象本身永远是不可变的。