python 一些方法的时间测试

时间:2023-03-08 19:58:49
python 一些方法的时间测试

尝试一些方法的不同实现,比较一下时间,电脑比较渣,不过只是做个比较

虽然用python主要是方便,肯定是不快的,不过能快一点还是快一点好

numpy中大量使用同样 shape 的全 0 array,可以使用 np.zero() 方法或者是先开一个之后 copy:

 %%time
for i in range(5000000):
a = np.zeros((100,10))
a = np.zeros((100,10))
a = np.zeros((100,10))
Wall time: 17.1 s
 %%time
b = np.zeros((100,10))
for i in range(5000000):
a = b.copy()
a = b.copy()
a = b.copy()
Wall time: 15.1 s

貌似先开一个,之后copy比较快,不过差异不明显

range() 还是 np.arrange(),最近用 array 有点多,经常啥都开 array

 %%time
for p in range(50000):
a = np.arange(100000)
Wall time: 3.72 s
%%time
for p in range(50000):
a = range(100000)
Wall time: 31 ms

差距还是非常明显(不用想都知道2333),如果不需要用 array 方法的时候,还是 list 好了

访问 list 等下标,用 range(长度),不过先保存长度成常量还是多次用 len 方法

 %%time
a = np.arange(100000)
l = len(a)
for p in range(50000000):
range(l)
Wall time: 23.3 s
 %%time
a = np.arange(100000)
for p in range(50000000):
range(len(a))
Wall time: 27.9 s

就这样看,应该调用 len 方法还是有点慢的,虽然差异也不是非常大,len 应该不是 O(n) 实现,可能是对象直接保存的一个属性,不过访问起来还是先存下来更快点

遍历一个 array ,同时使用标号

我会遍历下标长度的一个 list 来遍历它,用 zip 把标号和 array 合并,或者 emunerate ,或者干脆维护一个 id,循环中累加

 %%time
for i in range(5000000):
a = np.arange(10,30)
l = len(a)
for id in range(l):
x = id+a[id]
Wall time: 50 s
 %%time
for i in range(5000000):
a = np.arange(10,30)
b = zip(range(len(a)),a)
for item1,item2 in b:
x = item1+item2
Wall time: 51.2 s
 %%time
for i in range(5000000):
a = np.arange(10,30)
c = enumerate(a)
for item1,item2 in c:
x = item1+item2
Wall time: 52.3 s
 %%time
for i in range(5000000):
a = np.arange(10,30)
d = zip(np.arange(len(a)),a)
for item1,item2 in d:
x = item1+item2
Wall time: 52.9 s
 %%time
for i in range(5000000):
a = np.arange(10,30)
id = 0
for item in a:
x = id+item
id += 1
Wall time: 1min 1s

看上去只有维护 id 累加最慢,其他都差别不太大,那只要条件允许大概还是按 C 的习惯开一个下标的 list 来遍历下标好了