《Linux内核分析》
第六章 进程的描述和进程的创建
6.1 进程的描述
- 操作系统内核实现操作系统的三大管理功能:
- 进程管理(进程)—核心
- 内存管理(虚拟内存)
- 文件系统(文件)
- 为了管理进程,内核必须对每个进程进行清晰的描述,进程描述符提供了内核所需了解的进程信息。
- 用数据结构struct task_struct 来描述进程
- struct task_struct数据结构很庞大
- Linux进程的状态与操作系统原理中的描述的进程状态似乎有所不同,比如就绪状态和运行状态都是TASK_RUNNING,为什么呢?
- 进程的标示pid
- 所有进程链表struct list_head tasks; 内核的双向循环链表的实现方法 - 一个更简略的双向循环链表
- 程序创建的进程具有父子关系,在编程时往往需要引用这样的父子关系。进程描述符中有几个域用来表示这样的关系
- Linux为每个进程分配一个8KB大小的内存区域,用于存放该进程两个不同的数据结构:Thread_info和进程的内核堆栈
- struct thread_struct thread; //CPU-specific state of this task
- 文件系统和文件描述符
- 内存管理——进程的地址空间
- 进程描述符的结构示意图
- 进程状态转换图
6.2 进程的创建
- 分析fork函数对应的内核处理过程sys_clone,理解创建一个新进程如何创建和修改task_struct数据结构
- fork、vfork和clone三个系统调用都可以创建一个新进程,而且都是通过调用do_fork来实现进程的创建,do_fork完成了创建中的大部分工作,该函数调用copy_process()函数,然后让进程开始运行。copy_process()函数工作如下:
1、调用dup_task_struct()为新进程创建一个内核栈、thread_info结构和task_struct,这些值与当前进程的值相同
2、检查
3、子进程着手使自己与父进程区别开来。进程描述符内的许多成员被清0或设为初始值。
4、子进程状态被设为TASK_UNINTERRUPTIBLE,以保证它不会投入运行
5、copy_process()调用copy_flags()以更新task_struct的flags成员。表明进程是否拥有超级用户权限的PF_SUPERPRIV标志被清0。表明进程还没有调用exec()函数PF_FORKNOEXEC标志被设置
6、调用alloc_pid()为新进程分配一个有效的PID
7、根据传递给clone()的参数标志,copy_process()拷贝或共享打开的文件、文件系统信息、信号处理函数、进程地址空间和命名空间等
8、最后,copy_process()做扫尾工作并返回一个指向子进程的指针 - 过程:
- 更新menu代码到最新版、make rootfs,用help查看,新添加fork命令:
- 使用gdb跟踪调试内核,在一些重要函数处设置断点
- 对内核当中的sys_clone,fork,dup_task_struct,copy_thread,copy_process等函数进行端点设置
- ret_from_fork;决定了新进程的第一条指令地址。
原因如下: - copy_process()主要完成进程数据结构,各种资源的初始化。
p = dup_task_struct(current);
- (省略的IF语句)检查clone_flags参数,防止无效的组合进入
- p = dup_task_struct(current);调用dup_task_struct()为新进程创建一个内核栈
- 判断权限及允许范围的代码
- 对子进程的描述符初始化和复制父进程的资源给子进程
- retval = sched_fork(clone_flags, p);完成调度相关的设置,将这个task分配给CPU
- if (retval)语句群,复制共享进程的的各个部分
- retval = copy_thread(clone_flags, stack_start, stack_size, p);复制父进程堆栈的内容到子进程的堆栈中去.这其中,copy_thread()函数中的语句p->thread.ip = (unsigned long) - - --
- ret_from_fork;决定了新进程的第一条指令地址.
总结:
- Linux通过复制父进程来创建一个新进程,通过调用do_fork来实现
- Linux为每个新创建的进程动态地分配一个task_struct结构.
- 为了把内核中的所有进程组织起来,Linux提供了几种组织方式,其中哈希表和双向循环链表方式是针对系统中的所有进程(包括内核线程),而运行队列和等待队列是把处于同一- - 状态的进程组织起来
- fork()函数被调用一次,但返回两次