1.进程池Pool
需要创建的子进程数量不多时,可以直接利用multiprocessing中的Process动态成生多个进程,但如果是上百甚至上千个目标,手动的去创建进程的工作量巨大,此时就可以用到multiprocessing模块提供的Pool方法。
初始化Pool时,可以指定一个最大进程数,当有新的请求提交到Pool中时,如果池还没有满,那么就会创建一个新的进程用来执行该请求;但如果池中的进程数已经达到指定的最大值,那么该请求就会等待,直到池中有进程结束,才会用之前的进程来执行新的任务。
请看下面的实例:
import multiprocessing
import time
def copy_work():
print("拷贝中....",multiprocessing.current_process().pid)
time.sleep(0.3)
if __name__ == '__main__':
# 创建进程池, Pool(3) 表示创建容量为3个进程的进程池
pool = multiprocessing.Pool(3)
for i in range(10):
# 利用进程池同步拷贝文件,进程池中的进程会必须等上一个进程退出才能执行下一个进程
# pool.apply(copy_work)
pool.apply_async(copy_work)
pool.close()
# 注意:如果使用异步方式执行copy_work任务,主线程不再等待子线程执行完毕再退出!
pool.join()
同步方式:pool.apply() 运行结果:
异步方式 pool.apply_async(copy_work):
2. multiprocessing.Pool常用函数解析:
- apply() 使用同步的方式,去执行。
- apply_async(func[, args[, kwds]]):使用非阻塞方式调用func(并行执行,堵塞方式必须等待上一个进程退出才能执行下一个进程),args为传递给func的参数列表,kwds为传递给func的关键字参数列表;
- close():关闭Pool,使其不再接受新的任务;
- terminate():不管任务是否完成,立即终止;
- join():主进程阻塞,等待子进程的退出, 必须在close或terminate之后使用;
3.进程池中的Queue
如果要使用Pool创建进程,就需要使用multiprocessing.Manager()中的Queue(),而不是multiprocessing.Queue(),否则会得到一条如下的错误信息:
RuntimeError: Queue objects should only be shared between processes through inheritance.
下面的实例演示了进程池中的进程如何通信:
import multiprocessing
import time
# 写入数据的方法
def write_data(queue):
# for循环 向消息队列中写入值
for i in range(5):
# 添加消息
queue.put(i)
time.sleep(0.2)
# 创建读取数据的方法
def read_data(queue):
# 循环读取数据
while True:
# 判断队列是否为空
if queue.qsize() == 0:
print("队列为空~")
break
# 从队列中读取数据
result = queue.get()
print(result)
if __name__ == '__main__':
# 创建进程池
pool = multiprocessing.Pool(2)
# 创建进程池队列
queue = multiprocessing.Manager().Queue()
# 在进程池中的进程间进行通信
# 使用线程池同步的方式,先写后读
# pool.apply(write_data, (queue, ))
# pool.apply(read_data, (queue, ))
# apply_async() 返回ApplyResult 对象
result = pool.apply_async(write_data, (queue, ))
# ApplyResult对象的wait() 方法,表示后续进程必须等待当前进程执行完再继续
result.wait()
pool.apply_async(read_data, (queue, ))
pool.close()
# 异步后,主线程不再等待子进程执行结束,再结束
# join() 后,表示主线程会等待子进程执行结束后,再结束
pool.join()
运行结果:
0
1
2
3
4
队列为空~