python中常用的数据结构介绍

时间:2022-10-11 10:03:55

?
1
2
3
4
5
6
7
8
9
# 使用list作为栈
stack = [3, 4, 5]
 
# 入栈
stack.append(6)
# 出栈
val = stack.pop()
# 栈定元素
val = stack[-1]

队列

队列是fifo, 但是list对于first out效率不够高。通常用双端队列deque来实现队列

deque的特点是,两端添加和删除都是o(1)的时间复杂度

?
1
2
3
4
5
6
7
from collections import deque
queue = deque(["eric", "john", "michael"])
 
# 入队列
queue.append("terry")
# 出队列
queue.popleft()

元组

与list非常相似,但是tuple是不可变的数据结构

?
1
2
3
4
5
6
7
# 创建, 等号右边可以用括号扩起来
empty = ()
xyz = 12345, 54321, 'hello!'
one = 12345,
## unpacking
x, y, z = xyz
x, = one

tuple内部是可以有list这样可变的元素的

?
1
2
3
4
5
6
7
8
9
a = [1,2,3]
b = [4,5,6]
# 创建, 等号右边可以用括号扩起来
t = (a, b)
# ([1, 2, 3], [4, 5, 6])
a.append(4)
b.append(7)
print(t)
# ([1, 2, 3, 4], [4, 5, 6, 7])

如果tuple足够满足,那么tuple由以下两个优势:

  • 元组由于不可修改天然的线程安全
  • 元组在占用的空间上面都优于列表
?
1
2
3
4
5
6
import sys
t = tuple(range(2 ** 24))
l = [i for i in range(2 ** 24)]
 
# 比较内存使用
print(sys.getsizeof(t), sys.getsizeof(l))

tuple创建方式

?
1
2
3
4
5
6
7
8
9
10
11
12
13
import timeit
 
# 从range转换tuple 这种速度最快,推荐此方法
timeit.timeit('''t = tuple(range(10000))''', number = 10000)
 
# 从list创建tuple
timeit.timeit('''t = tuple([i for i in range(10000)])''', number = 10000)
 
# 从range创建tuple
timeit.timeit('''t = tuple(i for i in range(10000))''', number = 10000)
 
# unpacking生成器创建tuple
timeit.timeit('''t = *(i for i in range(10000)),''', number = 10000)

range

序列数据结构(list, tuple, range)的一种, 常与for循环一起使用

?
1
2
3
4
# 0 - 9
val = range(10)
val = range(0, 10)
val = range(0, 10, 1)

集合

python中常用的数据结构介绍

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
empty = set()
a = {1, 2, 3, 3, 3, 2}
b = {1, 3, 5, 7, 9}
 
# 超集和子集
a <= b
a.issubset(b)
b.issuperset(a)
 
# 交集
intersection = a & b
# 并集
union = a | b
# 差
subtraction = a - b
# 对称差
symmetric_difference = a ^ b

字典

字典由(key: value)对组成,对于key的要求是不可变类型(string, number等),

所以tuple可以作为key,但是list却不行。

?
1
2
3
4
5
6
7
8
# {'sape': 4139, 'guido': 4127, 'jack': 4098}
d = dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
 
# {2: 4, 4: 16, 6: 36}
d = {x: x**2 for x in (2, 4, 6)}
 
# {'sape': 4139, 'guido': 4127, 'jack': 4098}
d = dict(sape=4139, guido=4127, jack=4098)

但是如果tuple内包含可变类型,那么也不能作为key, 会出现如下错误:

?
1
typeerror: unhashable type: 'list'

生成式

生成式(list comprehensions)提供一种简洁的方式创建列表

?
1
2
3
4
5
6
7
8
# [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
# 创建列表
squares = []
for x in range(10):
 squares.append(x**2)
 
# 生成式
squares = [x**2 for x in range(10)]

条件语句

?
1
2
# [(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)]
[(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]

使用函数

?
1
2
3
# ['3.1', '3.14', '3.142', '3.1416', '3.14159']
from math import pi
[str(round(pi, i)) for i in range(1, 6)]

生成式嵌套

?
1
2
3
4
5
6
7
8
9
10
11
12
matrix = [
  [1, 2, 3, 4],
  [5, 6, 7, 8],
  [9, 10, 11, 12],
]
 
# 行列
matrix = [[row[i] for i in range(len(row))] for row in matrix]
 
# 列行
transposed = [[row[i] for row in matrix] for i in range(4)]
transposed = list(zip(*matrix))

生成器

生成器与生成式语法相似,只是生成器是懒加载模式,不会立即生成整个列表

?
1
2
3
4
5
6
7
8
9
10
import sys
# 元素已经就绪,耗费较多的内存
l = [i for i in range(2 ** 24)]
print(sys.getsizeof(l))
# 146916504 // 8 = 2 ** 24
 
# 创建生成器对象, 不占用额外空间,但是需要数据的时候需要内部运算
l = (i for i in range(2 ** 24))
print(sys.getsizeof(l))
# 128

除了上面的生成器语法,还有一种就是通过yield关键字

?
1
2
3
4
5
6
7
8
9
def fib(n):
  a, b = 0, 1
  for _ in range(n):
    a, b = b, a + b
    yield a
 
if __name__ == '__main__':
  for val in fib(20):
    print(val)

循环

列表循环

?
1
2
3
4
5
6
7
8
9
10
l = ['tic', 'tac', 'toe']
 
for index in range(len(l))
 print(index, l[index])
 
for val in l:
 print(val)
 
for index, val in enumerate(l):
 print(index, val)

字典循环

?
1
2
3
4
5
6
7
d = {'gallahad': 'the pure', 'robin': 'the brave'}
 
for key in d:
 print(key, d[key])
 
for key, val in d.items():
 print(key, val)

reversed

?
1
2
3
4
5
6
7
# [0, 2, 4, 6, 8]
for num in range(0, 10, 2):
 print(num)
 
# [8, 6, 4, 2, 0]
for num in reversed(range(0, 10, 2)):
 print(num)

zip

返回tuple的迭代器, 第i个元素来自于参数中每一个第i个元素, 长度等于最短的那个参数

以上就是python中常用的数据结构介绍的详细内容,更多关于python 数据结构的资料请关注服务器之家其它相关文章!

原文链接:http://blog.mogoal.com/python/python-datastruces