【原创】展开二层嵌套列表(或pd.Series)的几种方法效率对比

时间:2024-04-30 03:55:42


★二层嵌套列表(或以列表为元素的pd.Series)有以下几种展开方式
(1)列表生成式
(2)用np.sum方法(将外层列表中各个子列表相加)
(3)用sum方法(第二个参数传入一个空列表)
★但是谨记:对列表慎用sum方法!(以上3个方法只推荐使用第一个!!!)
因为——对于列表,无论是sum方法还是np.sum方法,效率都特别低!
    直接用列表生成式,效率高很多!
示例代码和结果如下:
import numpy as np
import pandas as pd
import time sr = pd.Series([list('sdkajksdfdsaf') for _ in range(20000)])
sr.head(5) >>>
0 [s, d, k, a, j, k, s, d, f, d, s, a, f]
1 [s, d, k, a, j, k, s, d, f, d, s, a, f]
2 [s, d, k, a, j, k, s, d, f, d, s, a, f]
3 [s, d, k, a, j, k, s, d, f, d, s, a, f]
4 [s, d, k, a, j, k, s, d, f, d, s, a, f]
dtype: object
start = time.time()
li1 = [i for k in sr for i in k]
time1 = time.time()
print('用生成式方法需要时间:', time1 - start) li2 = np.sum(sr)
time2 = time.time()
print('用np.sum方法需要时间:', time2 - time1) li3 = sum(sr, [])
time3 = time.time()
print('用sum方法需要时间:', time3 - time2) >>>
用生成式方法需要时间: 0.009999990463256836
用np.sum方法需要时间: 8.989910125732422
用sum方法需要时间: 8.979910373687744