众人拾柴火焰高---linux下的线程

一, 引入线程

  • 现代软件系统,除了进程之外,线程也是一个重要的概念,特别是随着CPU频率增长开始出现停滞,而开始向多核方向发展,多线程作为实现软件并发执行的一个重要的方法

二,什么是线程

1,线程概念

  • 在一个程序里的一个执行线路就叫做线程,是程序执行流的最小单元。
  • 线程是一个进程内部的控制序列,LINUX下没有真正的线程,因为LINUX下的线程是用进程PCB模拟的,所以LINUX下的线程也叫做轻量级的进程。
  • 线程是CPU调度的基本单位。

2,线程的组成

  • 一个标准的线程由线程ID、当前的指令指针、寄存器集合和堆栈组成。
  • 一个进程通常由一个到多个线程组成,各个线程之间共享程序的内存空间(包括代码段、数据段、堆等)及一些进程级的资源。
  • 一个进程和多个线程之间的关系如下图
     进程内的线程

3,多线程相对于单线程的优点

  • 某个操作可能会陷入等待时间,无法继续执行,多线程执行可以有效地利用等待时间。
  • 例如计算操作会消耗大量时间,如果只有一个线程,程序和用户之间交互会中断,多线程可以让一个线程负责交互,一个线程负责计算。
  • 多CPU或者多核计算机本身就具有同时执行多个线程的能力,因此单线程程序无法全面的发挥计算机的全部计算能力。
  • 相对于多进程应用,多线程在数据共享方面效率要高很多。

4,线程调度和优先级

线程调度
  • 无论是单处理器还是多处理器,线程总是并发执行的,在线程数量少于处理器数量时,各个线程运行在不同的处理器上,互不干扰,但是当线程数量多于处理器数量时,线程的并发会受到阻碍,因为一个处理器上要运行多个线程。
  • 当一个处理器上要处理多个线程时,操作系统会让这些多线程程序轮流执行,每一次执行很少时间,这样每个线程看起来是同时进行的,这样的一个在处理器上切换不同的线程的行为叫做线程调度
  • 在线程调度中,线程拥有三种状态:运行、就绪、等待。这三个状态的转移图如下图所示:
    线程状态转换
线程优先级
  • 线程调度的方法主要是线程优先级调度,优先级调度决定线程按照什么样的顺序轮流执行,在线程优先级调度的系统中,每个线程都有自己的优先级,优先级高的线程会更早执行,线程优先级决定本线程被执行的早或迟。
  • 在线程优先级调度的环境下,线程的优先级被改变有三种方式:1、用户指定优先级。2、根据进入等待状态的频繁程度提升或降低优先级,进入等待状态越频繁,说明线程占用处理器很短时间,这样的线程称之为IO密集型线程,进入等待时间少的线程称之为CPU密集型线程,IO密集型线程比CPU密集型线程容易得到优先级的提升。3、长时间得不到执行的线程,操作系统会提升其优先级。

三,线程安全

1,竞争与原子操作

  • 多线程程序处于一个多变的环境,从指定位置开始执行,并且共享当前进程的内存空间和文件等,因此多线程程序在并发时数据的一致性变得非常重要。
  • 我们把单指令的操作成为原子操作,因为无论如何,单指令的执行是不会被打断的。

2,同步与锁

  • 同步:为了避免多个线程同时读写同一个数据而产生不可预料的后果,我们要将各个线程对数据的访问同步,同步就是指一个线程访问数据未结束的时候,其他线程不得对同一个数据进行访问,如此对数据的访问就原子化了。
  • 实现同步的方法是使用锁,锁是一种非强制的机制,每一个线程在访问数据资源之前首先获取锁,并在访问结束的时候释放锁,在锁已经被占用的时候,线程会等待,知道锁重新可用。
  • 二元信号量:是最简单的锁,只有两种状态:占用和非占用。适用于只能被唯一一个线程独占访问的资源
  • 互斥量:和信号量很类似,资源仅同时允许一个线程访问。但和信号量不同的是,信号量在整个系统中可以被任意线程获取并释放,也就是说,同一个信号量可以被系统中的一个线程获取之后,然后由另一个线程释放。而互斥量则要求哪个线程获取互斥量,哪个线程来释放互斥量,其他线程释放互斥量是无效的。
  • 读写锁:对于一段数据,多个线程同时读取是没有问题的,但是当某一个线程试图对这个数据进行修改,就必须使用同步的手段来保证数据的安全,如果使用信号量,互斥量或者临界区来进行同步,可以保证程序的正确性,但是对于读取频繁,偶尔写入的情况,这些保证同步的手段会变得十分低效,读写锁可以避免这个问题,对于一个读写锁,有两种获取方式,共享的或者是独占的,当锁处于共享的状态,其他线程以共享的方式获取锁,是可以获取成功的,但是当一个锁以独占的方式获取这个锁的时候,它必然要等待这个锁被所有的线程释放,相应的,处于独占状态的锁将会阻止任何线程获取该锁,
    在这里插入图片描述
  • 条件变量:也是一同同步的手段,对于条件变量,线程可以有两种操作,首先线程可以等待一个条件变量,线程也可以唤醒一个条件变量,使用条件变量可以让大量线程等待某一个事件的发生,当事件发生的时候,所有的线程可以一起恢复执行。

猜你喜欢

转载自blog.csdn.net/wfc1998/article/details/87931152