Python的集合set原理
集合(set)是一个无序的不重复元素序列。
可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
|
class Array( object ):
def __init__( self , size = 32 , init = None ):
self ._size = size
self ._items = [init] * self ._size
def __getitem__( self , index):
return self ._items[index]
def __setitem__( self , index, value):
self ._items[index] = value
def __len__( self ):
return self ._size
def clear( self , value = None ):
for i in range ( len ( self ._items)):
self ._items[i] = value
def __iter__( self ):
for item in self ._items:
yield item
class Slot( object ):
"""定义一个 hash 表 数组的槽
注意,一个槽有三种状态,看你能否想明白
1.从未使用 HashMap.UNUSED。此槽没有被使用和冲突过,查找时只要找到 UNUSED 就不用再继续探查了
2.使用过但是 remove 了,此时是 HashMap.EMPTY,该探查点后边的元素扔可能是有key
3.槽正在使用 Slot 节点
"""
def __init__( self , key, value):
self .key, self .value = key, value
class HashTable( object ):
# 表示从未被使用过
UNUSED = None
# 使用过,但是被删除了
EMPTY = Slot( None , None )
def __init__( self ):
self ._table = Array( 8 , init = HashTable.UNUSED)
self .length = 0
# 负载因子
@property
def _load_factor( self ):
return self .length / float ( len ( self ._table))
def __len__( self ):
return self .length
# 哈希函数 用内置的哈希哈数进行哈希一下,然后对数组长度取模
def _hash( self , key):
return abs ( hash (key)) % len ( self ._table)
def _find_key( self , key):
# 得到第一个值的位置
index = self ._hash(key)
_len = len ( self ._table)
# 当这个槽不是未使用过的,才接着往下找;如果是未使用过的,这个key肯定不存在
while self ._table[index] is not HashTable.UNUSED:
# 槽使用过,但是被删除了
if self ._table[index] is HashTable.EMPTY:
# cpython解决哈希冲突的一种方式
index = (index * 5 + 1 ) % _len
continue
elif self ._table[index] = = key:
return index
else :
index = (index * 5 + 1 ) % _len
return None
# 检测槽是否能被插入
def _slot_can_insert( self , index):
return ( self ._table[index] is HashTable.EMPTY or self ._table[index] is HashTable.UNUSED)
# 找到能被插入的槽的index
def _find_slot_insert( self , key):
# 得到第一个值的位置
index = self ._hash(key)
_len = len ( self ._table)
while not self ._slot_can_insert(index):
index = (index * 5 + 1 ) % _len
return index
# in 操作符
def __contains__( self , key):
index = self ._find_key(key)
return index is not None
def add( self , key, value):
if key in self :
index = self ._find_key(key)
# 更新值
self ._table[index].value = value
return False
else :
index = self ._find_slot_insert(key)
self ._table[index] = Slot(key, value)
self .length + = 1
if self ._load_factor > 0.8 :
return self ._rehash()
return True
def _rehash( self ):
oldtable = self ._table
newsize = len ( self ._table) * 2
# 新的table
self ._table = Array(newsize, HashTable.UNUSED)
self .length = 0
for slot in oldtable:
if slot is not HashTable.UNUSED and slot is not HashTable.EMPTY:
index = self ._find_slot_insert(slot.key)
self ._table[index] = slot
self .length + = 1
def get( self , key, default = None ):
index = self ._find_key(key)
if index is None :
return default
else :
return self ._table[index].value
def remove( self , key):
index = self ._find_key(key)
if index is None :
raise KeyError
value = self ._table[index].value
self .length - = 1
# 把槽设置为空槽
self ._table[index] = HashTable.EMPTY
return value
def __iter__( self ):
for slot in self ._table:
if slot not in (HashTable.UNUSED, HashTable.EMPTY):
yield slot.value
class SetADT(HashTable):
def add( self , key):
return super (SetADT, self ).add(key, True )
def __and__( self , other_set):
# 求交集
new_set = SetADT()
for element_a in self :
if element_a in other_set:
new_set.add(element_a)
return new_set
def __sub__( self , other_set):
# 求差集
new_set = SetADT()
for element_a in self :
if element_a not in other_set:
new_set.add(element_a)
return new_set
def __or__( self , other_set):
# 求交集
new_set = SetADT()
for element_a in self :
new_set.add(element_a)
for element_b in other_set:
new_set.add(element_b)
return new_set
|
以上就是Python 实现集合Set的示例的详细内容,更多关于Python 实现集合Set的资料请关注服务器之家其它相关文章!
原文链接:https://www.cnblogs.com/guotianbao/p/12731390.html