python学习第七天 -- dict 和set

时间:2024-01-01 20:23:03

今天主要学习关于python 的dict(全称dictionary)和set。dict的用法跟javascript 中map表类似,key + value结构语言。而set,准确来说,只是key的集合。

Dict

直接贴代码

>>> d = {'zhangsan': 95, 'lixi': 75, 'wuliu': 85}
>>> d['zhangsan']
95

dict插入

>>>d['wangba'] = 90 //直接插入wangba该学员的成绩,再次打印d
>>>d
{'lixi': 45, 'wangba': 90, 'zhangsan': 95, 'wuliu': 76}

PS:dict 是一个无序的集合,上面的例子,你插入了一条记录,但是打印出来的顺序是无序的。

学过javascript知道,map中key只能对应一个唯一value,所以,多次对一个key放入value,后面的值会把前面的值冲掉:

>>> d['wangba'] = 88
>>> d['wangba']
88
>>> d['wangba'] = 66
>>> d['wangba']
66

如果key不存在,dict就会报错:

>>> d['liuhai']
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'c'

要避免key不存在的错误,有两种办法,一是通过in判断key是否存在:

>>>'liuhai' in d
False

二是通过dict提供的get方法,如果key不存在,可以返回None,或者自己指定的value:

>>> d.get('liuhai')
//空,不显示结果
>>> d.get('liuhai', -1)
-1

注意:返回None的时候Python的交互式命令行不显示结果。

Key删除

要删除一个key,用pop(key)方法,对应的value也会从dict中删除:

>>> d.pop('wangba')
90
>>> d
{'lixi': 45, 'zhangsan': 95, 'wuliu': 76}

再次提醒,dict内部存放的顺序和key放入的顺序是没有关系的,是一个无序的集合。

和list比较,dict有以下几个特点:

  1. 查找和插入的速度极快,不会随着key的增加而变慢;
  2. 需要占用大量的内存,内存浪费多。

而list相反:

  1. 查找和插入的时间随着元素的增加而增加;
  2. 占用空间小,浪费内存很少。

所以,dict是用空间来换取时间的一种方法

dict可以用在需要高速查找的很多地方,在Python代码中几乎无处不在,正确使用dict非常重要,需要牢记的第一条就是dict的key必须是不可变对象

这是因为dict根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。这个通过key计算位置的算法称为哈希算法(Hash)

要保证hash的正确性,作为key的对象就不能变。在Python中,字符串、整数等都是不可变的,因此,可以放心地作为key。而list是可变的,就不能作为key:

>>> key = [1, 2, 3]
>>> d[key] = 'a list'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'

Set

set相对与dict来讲,就是只存储key,不存储value。

直接贴代码:

>>>s = set([1,2,3])
>>>s
>>>set([1,2,3])

set 插入key:

>>>s.add(4)
>>>s
set([1, 2, 3, 4])

如果set插入重复的key:

>>> s.add(2)//key 重复的会被处理,不能出现重复的key
>>> s
set([1,2, 3, 4])

set 移除key:

>>> s.remove(1)
>>> s
set([2, 3, 4])

PS:set的特点跟dict类似,都是无序的集合,key都是不可变的,同样list不能作为key。

上面我们一直将python整数和字符串指向的内容是不可变的。何为内容不可变?看下面的例子,从网上摘抄:

>>> a = 'abc'
>>> a.replace('a', 'A')
'Abc'
>>> a
'abc'

虽然字符串有个replace()方法,也确实变出了'Abc',但变量a最后仍是'abc',应该怎么理解呢?

我们先把代码改成下面这样:

>>> a = 'abc'
>>> b = a.replace('a', 'A')
>>> b
'Abc'
>>> a
'abc'

要始终牢记的是,a是变量,而'abc'才是字符串对象!有些时候,我们经常说,对象a的内容是'abc',但其实是指,a本身是一个变量,它指向的对象的内容才是'abc'

当我们调用a.replace('a', 'A')时,实际上调用方法replace是作用在字符串对象'abc'上的,而这个方法虽然名字叫replace,但却没有改变字符串'abc'的内容。相反,replace方法创建了一个新字符串'Abc'并返回,如果我们用变量b指向该新字符串,就容易理解了,变量a仍指向原有的字符串'abc',但变量b却指向新字符串'Abc'了。

所以,python对于不变对象来说,调用对象自身的任意方法,也不会改变该对象自身的内容。相反,这些方法会创建新的对象并返回

这样,就保证了不可变对象本身永远是不可变的。