作者：@小萌新
专栏：@Linux
作者简介：大二学生希望能和大家一起进步！
本篇博客简介：简单介绍下进程地址空间

程序地址空间

程序地址空间

程序地址空间

语言中的程序地址空间

我们在c语言中的学习中我们是这样子描述内存空间的

内存包括栈区堆区静态区

栈区是向低地址增长的

堆区是向高地址增长的

其中静态区又分为三部分分别是初始化数据未初始化数据数据段和代码段
在这里插入图片描述

我们可以通过下面的代码来验证上面的这张图

在这里插入图片描述

我们发现运行的结果和我们的结论是吻合的
在这里插入图片描述

矛盾

我们首先写出下面的一段代码

在这里插入图片描述
这段代码的意思是让子进程执行五次分别打印子进程的pid myval和地址

让父进程一直执行分别打印父进程的pid myval和地址

在这里插入图片描述
效果是这样子的我们可以发现父子进程打印出来的val一样地址也一样

但是如果我们在中途修改子进程的val数据呢？会发生什么情况

如果按照我们之前语言中的内存理解我们可以推断出父进程的val值也会被改变因为它们指向的都是同一块地址那么事实到底是不是这样子呢？

我们可以试验一下

对于原先的代码做出如下修改

在这里插入图片描述
运行结果如下

在这里插入图片描述
我们惊奇的发现一个地址里面的值竟然有两种形态

这很显然不符合我们的常识

一个物理地址中对应的值只能有一个所以说这里的地址肯定不是真正的物理地址那么它是什么呢？

系统中的程序地址空间

实际上我们在语言层面上打出来的地址都不是真实的物理地址而是由操作系统分配的虚拟地址

所以说尽管我们看上去父子进程的虚拟地址是一样的但是它们实际的物理地址却是不一样的这也就造成的上面那种一个地址中会出现两个值的情况

实际转化效果如图
在这里插入图片描述

我们前面的博客说过贯穿操作系统的一句话叫做 先描述再组织

我们语言阶段所说的内存实际上是虚拟内存地址而到了系统的学习中

我们给与了它一个新的名字叫做进程地址空间

它是操作系统对于开辟空间的描述实际上它就是一个结构体 叫做mm_struct

进程地址空间就类似于一把尺子尺子的刻度由0x00000000到0xffffffff 尺子按照刻度被划分为各个区域例如代码区、堆区、栈区等

而在结构体mm_struct当中便记录了各个边界刻度例如代码区的开始刻度与结束刻度如下图所示

在这里插入图片描述
再这个结构体中每一个刻度都代表着一个虚拟地址这些虚拟地址通过页表和物理地址建立联系

而由于这些地址是线性增长的所以说我们也可以将虚拟地址叫做线性地址

在这里插入图片描述

从上面的图我们可以知道

操作系统在创建进程的时候会创建PCB和程序地址空间

在进程运行的时候程序地址空间会经过页表映射到真实的物理内存中开辟新的空间

我们前面的博客说过父子进程是共享代码和大部分数据的

这也就是为什么一开始的时候我们查看代码时父子进程的val数据地址一样的原因

但是当我们要修改子进程的数据的时候就会发生 缺页中断 由于要保持进程的独立性所以这里会用到一种叫做写时拷贝的技术

将父进程的数据拷贝一份到真实的物理内存中修改之

但是这在虚拟内存层面是看不到的这也就是为什么我们修改数据之后依然看到父子进程myval的地址是一致的

在这里插入图片描述

为什么要有进程地址空间

有了进程地址空间之后就不会出现系统级别的越界问题了可以防止恶意程序修改真实的内存数据和破坏计算机

这是因为加了一个中间件之后程序就失去了访问真实物理内存的权力而是由操作系统进行管理
将内存申请和使用概念划分清楚从而让进程续写和内存管理操作进行分离

这是因为使用物理内存的权力在操作系统手上它可以通过“欺骗”程序让他误以为自己申请成功了真正的物理内存
操作系统可以在程序使用内存的时候再分配给程序
每个进程都认为自己在独占内存这样能更好的完成进程的独立性以及合理使用内存空间
每个进程都认为自己能独占内存所以说它们会按照操作系统给的内存分布区规划使用更加方便管理并且进程之间解耦

我们现在对于进程创建的理解要更加加深一点

理解为 PCB + 程序 + mm_sturct + 页表

思维导图总结

在这里插入图片描述

【Hello Linux】程序地址空间