python:并发编程(十四)

前言

本文将和大家一起探讨python并发编程中多进程、多线程、多协程之间是如何工作,或许你会好奇“进程里面如何启动多线程”、“协程是否可以启动进程”之类的问题。本文将会一一解答这些问题。

本文为python并发编程的第十四篇,上一篇文章地址如下:

python:并发编程(十三)_Lion King的博客-CSDN博客

下一篇文章地址如下:

python:并发编程(十五)_Lion King的博客-CSDN博客


一、混合编程

1、多进程、多线程、多协程

下面是一个使用multiprocessingthreadingasyncio三个模块实现多进程中包含多线程,多线程中包含多协程的混合编程的示例代码:

import multiprocessing
import threading
import asyncio

async def coroutine_func():
    print("在协程中运行")

def thread_func():
    asyncio.run(coroutine_func())

def process_func():
    # 创建一个线程并将其目标设置为 thread_func 函数
    thread = threading.Thread(target=thread_func)
    thread.start()
    thread.join()

if __name__ == '__main__':
    # 创建一个进程并将其目标设置为 process_func 函数
    process = multiprocessing.Process(target=process_func)
    process.start()
    process.join()

在这段代码中,我们使用 multiprocessing.Process 创建了一个独立的进程。在进程内部,我们使用 threading.Thread 创建了一个线程,并将其目标设置为 thread_func 函数。在 thread_func 函数中,我们使用 asyncio.run() 来运行协程函数 coroutine_func

请注意,这段代码只能在主线程或程序的入口点中正常运行。在某些交互式环境(如 Jupyter Notebook)中可能无法按预期工作。

2、协程启动线程

以下是一个示例代码,展示了如何在协程中启动线程:

import asyncio
import threading
import time

# 协程函数
async def coroutine_function():
    print("协程函数开始")

    # 创建一个线程并启动
    thread = threading.Thread(target=thread_function)
    thread.start()

    # 等待线程完成
    await asyncio.sleep(2)

    print("协程函数结束")

# 线程函数
def thread_function():
    print("线程开始")
    # 进行一些耗时操作
    for i in range(5):
        print("线程执行中...")
        time.sleep(1)
    print("线程结束")

# 创建事件循环
loop = asyncio.get_event_loop()

# 运行协程
loop.run_until_complete(coroutine_function())

# 关闭事件循环
loop.close()

在上述示例中,我们定义了一个协程函数coroutine_function(),在该函数中启动了一个线程thread,并在协程中等待线程完成。线程函数thread_function()执行一些耗时操作,然后结束。

在主程序中,创建了一个事件循环loop,然后运行协程函数coroutine_function(),最后关闭事件循环。

请注意,示例中使用了threading模块创建和启动线程,而非asyncio模块。协程和线程是两种不同的并发编程模型,它们有各自的特点和适用场景。在协程中启动线程时,需要注意线程安全性和数据共享的问题,并确保适当的同步机制。

3、协程启动进程

下面是一个示例代码,演示了如何在协程中通过multiprocessing模块使用进程:

import asyncio
import multiprocessing

# 子进程要执行的任务
def process_function():
    print("子进程开始")
    # 执行一些任务...
    print("子进程结束")

# 协程要执行的任务
async def coroutine_function():
    print("协程开始")
    # 创建并启动新的进程
    process = multiprocessing.Process(target=process_function)
    process.start()
    process.join()  # 等待子进程结束
    print("协程结束")

async def main():
    print("主协程开始")

    # 创建并运行协程任务
    coroutine_task = asyncio.create_task(coroutine_function())
    await coroutine_task

    print("主协程结束")

if __name__ == '__main__':
    # 创建并运行事件循环
    loop = asyncio.get_event_loop()
    loop.run_until_complete(main())
    loop.close()

在这个示例中,我们定义了一个协程任务coroutine_function,其中创建了一个新的进程,并通过start()方法启动它。然后,我们使用join()方法等待子进程结束。在main函数中,我们创建并运行了主协程任务,并使用事件循环运行它。

需要注意的是,在协程中启动进程时,需要确保在协程任务中的某个点使用了await关键字,以便让事件循环有机会切换到其他协程。否则,协程可能无法正常运行和切换。

当然,你也可以在协程中使用asynciorun_in_executor方法来委派耗时的任务给进程池执行。这样可以在协程中启动进程。以下是一个示例代码:

import asyncio
import concurrent.futures
import time

# 耗时的任务函数
def process_function():
    # 执行一些耗时的操作
    print("进程开始")
    for i in range(5):
        print("进程执行中...")
        time.sleep(1)
    print("进程结束")

# 协程函数
async def coroutine_function():
    print("协程函数开始")
    
    # 在进程池中执行耗时任务
    loop = asyncio.get_event_loop()
    executor = concurrent.futures.ProcessPoolExecutor()
    await loop.run_in_executor(None, process_function)
    
    print("协程函数结束")

# 创建事件循环
loop = asyncio.get_event_loop()

# 运行协程
loop.run_until_complete(coroutine_function())

# 关闭事件循环
loop.close()

在上述示例中,我们定义了一个耗时的任务函数process_function(),该函数模拟了一个耗时的进程任务。在协程函数coroutine_function()中,我们使用asynciorun_in_executor方法委派耗时任务给进程池执行。

请注意,示例中使用了concurrent.futures.ProcessPoolExecutor来创建进程池,并通过loop.run_in_executor方法将任务提交到进程池中执行。在实际的使用中,你可以根据需要调整进程池的大小和配置,以满足具体的并发需求。

4、线程启动进程

在Python中,线程可以通过multiprocessing模块启动新的进程。下面是一个示例代码,演示了如何在线程中创建和启动新的进程:

import multiprocessing
import threading

# 子进程要执行的任务
def process_function():
    print("子进程开始")
    # 执行一些任务...
    print("子进程结束")

# 线程要执行的任务
def thread_function():
    print("线程开始")
    # 创建并启动新的进程
    process = multiprocessing.Process(target=process_function)
    process.start()
    process.join()  # 等待子进程结束
    print("线程结束")

if __name__ == '__main__':
    print("主线程开始")

    # 创建并启动新的线程
    thread = threading.Thread(target=thread_function)
    thread.start()
    thread.join()  # 等待线程结束

    print("主线程结束")

在这个示例中,我们在线程的任务函数thread_function中创建了一个新的进程,并通过start()方法启动它。然后,我们使用join()方法等待子进程结束。最后,主线程继续执行其他任务。

二、有趣的问题

1、协程可以启动线程和进程吗?

前面的例子不是明摆着么?很明显可以啊!其实不然,上述示例其实是间接启动的

协程本身不能直接启动线程或进程,因为协程是在单线程内进行调度和执行的,并且受到事件循环的管理。

协程主要用于实现在单线程内的并发编程,通过事件循环机制在单线程内调度和执行协程任务。协程的调度和执行是非抢占式的,需要协程主动让出控制权,才能切换到其他协程执行。

如果需要启动线程或进程,可以通过协程和相关模块结合起来实现。

(1)对于线程,可以在协程内使用threading模块来创建和管理线程。可以将需要在线程中执行的任务包装成一个线程函数,并在协程内使用threading.Thread来创建线程对象,然后启动线程执行任务。

(2)对于进程,可以在协程内使用multiprocessing模块来创建和管理进程。可以将需要在进程中执行的任务包装成一个进程函数,并在协程内使用multiprocessing.Process来创建进程对象,然后启动进程执行任务。

需要注意的是,由于协程是在单线程内调度和执行的,协程与线程或进程之间的切换是有一定开销的,因此在使用协程启动线程或进程时,需要考虑到切换开销和线程/进程之间的通信方式。

2、进程可以直接启动线程和协程么?

在Python中,进程可以直接启动线程,但不能直接启动协程。这是因为协程是基于单线程的异步编程模型,而进程是独立的执行单元,它们具有不同的执行上下文和资源隔离。

使用Python的multiprocessing模块,可以创建和管理进程,并在进程中启动线程。这样可以实现多进程和多线程的组合。通过在每个进程中启动线程,可以充分利用多核处理器的并行性,并同时执行多个线程任务。

然而,协程的执行是由单线程的事件循环控制的,它们在同一个线程内按顺序执行。在Python中,协程通常使用asyncio模块来管理和调度。协程的特点是非阻塞和轻量级,它们通常在单个线程内进行切换和执行。虽然进程可以启动线程,但无法直接启动协程。

如果需要结合使用进程、线程和协程,可以通过在进程或线程中使用协程来实现。例如,在多进程或多线程的每个执行单元中,可以使用asyncio来创建和调度协程,以实现并发和异步操作。这种组合的方式可以根据具体的需求和场景进行选择和设计。

3、协程可以间接启动线程和进程,这样做有意义么?

在一些特定的情况下,协程间接启动线程和进程可能是有意义的,具体取决于应用程序的需求和场景。以下是一些可能的应用场景:

(1)利用并发能力:协程在单线程内实现并发,而线程和进程可以实现真正的并行。如果应用程序需要同时执行多个任务,并且某些任务是阻塞的或者需要CPU密集型的计算,通过在协程中间接启动线程或进程,可以利用它们的并行能力来加速任务的执行。

(2)利用特定的功能:线程和进程提供了一些特定的功能和特性,例如可以与底层系统进行交互、使用多核处理器、执行一些需要隔离的任务等。通过在协程中间接启动线程或进程,可以利用它们提供的功能来满足特定需求。

(3)跨语言集成:有时候需要在协程中调用其他语言编写的库或代码,而这些库或代码可能只能在独立的线程或进程中运行。通过在协程中间接启动线程或进程,可以在协程中调用其他语言的功能,并与协程进行交互。

需要注意的是,间接启动线程和进程会引入额外的复杂性和开销,包括线程/进程切换、通信机制、资源管理等方面。在设计和实现时需要仔细考虑并权衡利弊,并确保正确地处理线程/进程间的同步和通信问题,以避免潜在的并发错误和性能问题。在大多数情况下,如果仅仅需要利用并发能力,直接使用协程的方式已经足够满足需求。

4、进程、线程、协程通常怎么配合使用?

进程、线程和协程是并发编程中常用的三种机制,它们可以相互配合使用以实现不同的并发需求。

一般情况下,它们的配合使用方式如下:

(1)进程和线程的配合使用:
①使用多进程和多线程可以实现多任务并发执行的效果。多进程可以充分利用多核CPU资源,而多线程可以充分利用单个进程内的多个线程资源。
②进程之间可以通过进程间通信(IPC)机制进行数据交换和同步,例如使用队列、管道、共享内存等。
③线程之间可以通过共享内存进行数据交换,但需要注意线程安全的问题,如使用锁、条件变量等进行同步。

(2)线程和协程的配合使用:
①在单个线程中使用协程可以实现高效的并发编程。协程的切换是由程序自身控制的,可以避免线程切换的开销。
②使用线程来管理和调度多个协程,例如使用asyncio模块提供的线程安全的事件循环和协程调度器。
③在多线程环境中使用协程时,需要注意线程安全和协程之间的同步问题,如使用锁、条件变量等进行协程间的同步。

(3)进程、线程和协程的综合应用:
①在复杂的并发场景中,可以综合使用进程、线程和协程来实现更灵活和高效的并发编程。
②例如,可以使用多进程和多线程的组合来实现并行计算,同时在每个线程中使用协程来处理IO密集型任务。
③进程和线程之间可以通过进程间通信和线程间通信来实现数据交换和同步。
④协程可以在每个线程中提供更细粒度的任务调度和切换,以提高并发执行效率。

总之,进程、线程和协程的选择和配合使用取决于具体的应用场景和需求。需要根据任务的性质、并发程度和资源限制等因素进行综合考虑,以实现高效、可靠和可扩展的并发编程。

5、协程通过线程模块可以控制线程,通过进程模块可以控制进程,这样理解对吗?

部分正确,即能启动不代表能控制,也许换个场景好理解一些,如进程可以创建线程,线程可以创建协程,创建的对象都由创建者控制,在其内部里面,而协程创建的进程或协程不可能在协程里面。在Python中,协程通过asyncio模块来实现,并且协程主要在单线程内调度和执行。协程的调度和执行是由事件循环(Event Loop)机制来控制的。

协程与线程和进程是不同的概念,它们具有不同的并发执行方式和调度机制。

(1)协程(Coroutine)是一种轻量级的并发编程模型,它在单线程内通过协作式调度实现并发。协程通过asyncio模块来创建和管理,使用awaitasync关键字来定义和调用协程函数。协程的调度和执行由事件循环(Event Loop)机制来控制。

(2)线程(Thread)是操作系统级别的并发执行单位。线程是由操作系统内核调度和执行的,可以在多个CPU核心上并行执行。在Python中,可以使用threading模块来创建和管理线程。但是需要注意,Python中的全局解释器锁(Global Interpreter Lock,GIL)限制了多线程的并行执行能力,导致在CPU密集型任务中多线程并不能真正实现并行加速。

(3)进程(Process)是独立的执行环境,拥有独立的内存空间和系统资源。不同的进程之间是相互隔离的,它们可以在不同的CPU核心上并行执行。在Python中,可以使用multiprocessing模块来创建和管理进程。每个进程都有自己的解释器和全局解释器锁,因此在多进程中可以实现真正的并行执行。

需要注意的是,协程与线程和进程是不同的并发编程概念,它们具有不同的优势和适用场景。协程适合处理I/O密集型任务,能够充分利用系统资源,提高并发能力。而线程和进程适合处理CPU密集型任务,能够实现真正的并行加速。

6、同一时刻只有一个线程在工作吗?

在Python中,由于全局解释器锁(Global Interpreter Lock,GIL)的存在,同一时刻只有一个线程能够执行Python字节码。这意味着在单个Python进程中,虽然可以创建多个线程,但这些线程无法并行执行Python代码。

GIL的存在是为了保证Python解释器的线程安全性,它通过限制对Python对象的并发访问来简化线程间的同步。因为GIL的存在,多线程在CPU密集型任务上无法充分利用多核处理器的优势,因为同一时刻只有一个线程能够执行Python代码。

然而,GIL在处理IO密集型任务时并不会成为瓶颈。当线程处于阻塞状态时,例如进行网络请求、文件读写等IO操作时,GIL会被释放,其他线程就有机会执行。这使得在IO密集型任务中,使用多线程能够提高并发性能。

需要注意的是,虽然只有一个线程能够执行Python字节码,但在遇到IO操作时,可以使用异步编程模型,例如使用asyncio库中的协程。通过使用异步IO,可以充分利用CPU的空闲时间,让其他协程或任务执行,从而实现并发处理。

因此,尽管Python中同一时刻只有一个线程在执行Python字节码,但通过适当的编程模型选择,如使用多线程处理IO密集型任务或使用协程处理异步IO任务,仍然可以实现并发执行和提高性能的效果。

7、python多个进程下的线程是否能同时工作

在Python中,多个进程之间的线程是可以同时工作的。由于每个进程都有自己独立的Python解释器和全局解释器锁(GIL),因此每个进程可以并行执行其内部的线程。

当多个进程同时运行时,每个进程都有自己的资源和执行环境,它们之间相互独立。因此,进程中的线程可以并行执行,利用多核处理器的优势,同时进行任务处理。

需要注意的是,虽然多个进程下的线程可以同时工作,但进程之间的通信和数据共享会涉及到进程间通信(IPC)的机制,如共享内存、管道、队列等。这些机制可以用于在多个进程之间传递数据或进行协作。

总结起来,Python中多个进程下的线程可以同时工作,但进程之间的通信和数据共享需要适当的机制来实现。这样可以充分利用多核处理器的能力,并提高并行处理的性能。

猜你喜欢

转载自blog.csdn.net/weixin_43431593/article/details/131262044