注意:多线程和多线程编程是不同的!!!
第一点:一个进程相当于一个要执行的程序,它会开启一个主线程,多线程的话就会再开启多个子线程;
第二点:python设计之初没有多核CPU,所以它的多线程是一种并发操作(伪并行),它相当于把CPU的时间片分成一段一段很小的片段,然后分给各个线程交替进行,由于每个片段都很短,所以看上去像平行操作;
举个例子:现在有一个16核的CPU,一个要执行的数据读取任务A,我们将A分成多个进程并行操作,每个进程放到一个核上;但是如果将这个任务A用一个进程(开多个线程)完成的话,虽然一个核心同一时间处理一个线程,按理说16核可以同时处理16个线程(未考虑超线程技术),但由于python的缺陷,这里面的多线程依然是并发(伪并行)的,所以效率低;
(1)多线程操作案例:
import threading class MyThread(threading.Thread):
def __init__(self , thread_ID , thread_name , person_list):
threading.Thread.__init__(self)
self.thread_ID = thread_ID
self.thread_name = thread_name
self.person_list = person_list
def run(self):
print("开始进程:" + self.thread_name)
main(self.person_list , self.thread_name) #main是自定义要进行多线程操作的函数
print("结束进程:" + self.thread_name) def main(person_list , thread_name):
......
#multi-thread
multi_thread = []
for i in range(THREAD_NUM):
multi_thread.append(MyThread(i , "Thread_" + str(i) , person_per_thread[i]))
for i in range(THREAD_NUM):
multi_thread[i].start() #start只是开启了多线程,之后会自动发起线程模块中的run操作;
print("{} start!".format(time.ctime(time.time())))
for i in range(THREAD_NUM):
multi_thread[i].join() #join()是为了保证主线程在多线程开启的子线程都结束后再结束,这样子可以防止主线程在子线程结束前结束,一般join都和start配合使用
(2)多进程操作案例:
可以直接使用python库:Pool进程池;
from multiprocessing import Pool , freeze_support #multi-processing
freeze_support()
pool = Pool(PROCESS_NUM)
for i in range(PROCESS_NUM):
pool.apply_async(func = main , args = (person_per_thread[i] , str(i) , ))
#main是自定义的要进行多进程编程的函数
pool.close()
pool.join()