一、深入python的set和dict
1.1、dict的abc继承关系
from collections.abc import Mapping,MutableMapping
#dict属于mapping类型
a = {} #字典a不是继承MutableMapping,而是实现了MutableMapping的魔法函数
print(isinstance(a,MutableMapping)) #True
1.2、dict的常用方法
a = {"lishuntao":{"company":"hut"},
"lishuntao1":{"company":"hut1"}
}
#clear
# a.clear()
# print(a) #{} #copy,返回浅拷贝
# new_dict = a.copy()
# new_dict["lishuntao"]["company"] = "HUT" #new_dict拷贝出"lishuntao"与"lishuntao1"这是浅拷贝,
# # 第二层的dict也就是数据结构没有被拷贝出来,因此值会变动。
# print(new_dict) #{'lishuntao': {'company': 'HUT'}, 'lishuntao1': {'company': 'hut1'}}
# print(a) #{'lishuntao': {'company': 'HUT'}, 'lishuntao1': {'company': 'hut1'}} #深拷贝
import copy
new_dict = copy.deepcopy(a)
new_dict["lishuntao"]["company"] = "HUT"
print(a) #{'lishuntao': {'company': 'hut'}, 'lishuntao1': {'company': 'hut1'}}
print(new_dict) #{'lishuntao': {'company': 'HUT'}, 'lishuntao1': {'company': 'hut1'}} #fromkeys 将可迭代的对象转换为dict
new_list = ["li","li1","li2"]
new_dict = dict.fromkeys(new_list,{"company":"hut"})
print(new_dict) #{'li': {'company': 'hut'}, 'li1': {'company': 'hut'}, 'li2': {'company': 'hut'}} #get #如果没有这个键不会抛异常
value = a.get("lishuntao111",{})
print(value) #{} #items()
for key,value in a.items():
print(key,value) #lishuntao {'company': 'hut'},lishuntao1 {'company': 'hut1'} #setdefault
new_dict = a.setdefault("litao","hugongda")
print(new_dict) #hugongda
print(a) #{'lishuntao': {'company': 'hut'}, 'lishuntao1': {'company': 'hut1'}, 'litao': 'hugongda'} #update #可迭代的对象
#a.update([("lishun","tao"),("li110","hu")])
a.update(lishun='tao',li110="hu")#一样的效果
1.3、dict的子类
# #不建议继承dict和list
# class Mydict(dict):
# def __setitem__(self, key, value):
# super(Mydict, self).__setitem__(key,value*2)
#
# my_dict = Mydict(one=1)
# print(my_dict) #{'one': 1}
# my_dict["one"] = 1 #{'one': 2}
# print(my_dict)
# """
# 在某些情况下,用C语言写出来的python内置类型,它不会调用__setitem__方法
# 因此我们想要继承dict的话,就去继承UserDict(例如下面)
# """
from collections import UserDict
#
#
# class Mydict1(UserDict):
# def __setitem__(self, key, value):
# super(Mydict1, self).__setitem__(key,value*2)
#
# my_dict = Mydict1(one=1)
# print(my_dict) #{'one': 2}
# my_dict["one"] = 1 #{'one': 2}
# print(my_dict) from collections import defaultdict
"""
defaultdict重写了__missing__方法
"""
my_dict = defaultdict(dict)
my_value = my_dict["lishun"] #按照正常情况会报错误
print(my_value) #{} my_dict1 = {}
my_value1 = my_dict1["lishun"]
print(my_value1) #KeyError: 'lishun'
1.4、set和frozenset
#set 集合 frozenset 不可变集合 无序、不重复
s = set("abcde")
s.add("u")
print(s)#{'b', 'a', 'e', 'd', 'c', 'u'} s2 = frozenset("abcdef") #frozenset 可以作为dict的key
print(s2) #frozenset({'b', 'f', 'a', 'e', 'd', 'c'}) #不能修改 #difference
anoth_set = set("cdefgh")
res = s.difference(anoth_set)
print(res) #{'a', 'b', 'u'} #集合运算 交 并 差集
res = s - anoth_set
res1 = s & anoth_set #交
res2 = s | anoth_set #并
#set性能高 #实现__contains__魔法函数就可以做if判断
1.5、dict和set的实现原理
dict和list查找元素,dict查找的性能远远大于list,在list中随着list数据的增大查找时间增大,在dict中查找元素不会随着数据的增大而增大,dict的实现原理叫做哈希表。哈希表的存储逻辑,哈希表的右边是数值的存储结构,是连续的数组,这个数组里存了指向key和value的指针。
哈希表的查找:首先计算dict的键的hash值,然后利用hash值定位数组中的一个表元,此时判断表元是否为空,如果表元为空,直接抛出KeyError,如果表元不为空,则判断键是否相等,如果相等的话返回表元里的值,如果不相等的话,则使用hash值的另一部分来定位hash表的另一行,然后又判断表元是否为空进入下一次判断循环。
特性:
1、dict的key或者set的值都必须是可以hash的(不可变对象,都是可以hash的,str,frozenset,tuple,自己实现的类__hash__都是可以hash的)
2、dict的内存花销大,但是查询速度快,自定义的对象或者python内部的对象都是用dict包装的
3、dict的存储顺序和元素添加顺序有关
4、添加数据有可能改变已有的数据的顺序