1. ”进程“是什么

在对比"进程"和"线程"两者之间的区别前,我们需要先了解什么是"进程"?什么是"线程"?

“进程”(process)也叫"任务"(task) 即咱们电脑的任务管理器中有个进程页面,这个页面所展示的都是电脑里正在运行的一些进程.只有当一个程序跑起来了,才能叫"进程",否则不算是"进程",像电脑磁盘里放着一些文件、可执行程序等等这些都不能算是进程!

在这里插入图片描述

一个系统在同一时刻可以跑多个进程,每个进程都会消耗一些资源CPU,内存,磁盘,网络…所以当进程多了电脑了就卡了呗.(有的人说是C盘东西多了,电脑卡清一清就没事了,其实也跟这个有一定关联,当你把软件卸了,对应着"进程"也就没了.因此电脑卡的本质就是同一时刻进程数量太多,CPU扛不住了~.那么这个时候就有大聪明说了:“那我在网上下载的学习资料,会不会导致电脑卡呢”?一般来说是不会卡的,因为下载后它只是一个程序,并没有运行起来,不过当你把学习资料打开了俺就不知道卡不卡咯<=_<=)因此"进程"是操作系统资源的分配单位,"进程"是由操作系统内核负责管理.

1.2 管理进程

“进程"是一个重要的"软件资源”,**是由操作系统内核负责管理的.**这里的管理分两部分:描述,组织.

所谓描述即有哪些属性和特征;组织即通过一定的数据结构把多个这样的基本单位(进程)串起来.

一、描述: 使用结构体(C语言)描述"进程"属性,这个结构体有个特殊的名字**“PCB”(进程控制块);**

  1. 进程持有哪些硬件资源:

a)pid:进程的身份标识符(唯一数字).

b)内存指针: 指向了当前对象的内存是哪些.(分配内存)

c)文件描述附表: 硬盘文件等其他资源.

以上资源都比较好分配,不好分配的资源"CPU",我们看到在任务管理器上跑着上百个"进程",而CPU只有一个(现在都是多核心CPU),为了能够保证这些进程能"同时运行",“分时复用”,于是涉及到以下两个概念:

并行: 微观上同一时刻,两个核心上的进程,用时执行.

并发: 微观上,同一时刻,一个核心只能运行一个进程,但是它能够对多个进程之间进行超快速的切换.我们看起来好像是在同时运行.

“并行"和"并发"往往统称为"并发”.因此并发解决了多个进程运行.而为了分配有限的CPU,操作系统提供了一个调度器模块,来负责调度CPU执行这么多个进程.而引入进程就是为了解决"并发编程"问题.

  1. 进程调度的相关属性:

    a)进程的状态:

    就绪状态:随时准备去cpu执行

运行状态: 正在执行

阻塞状态: 一个进程短时间内无法响应.

b)优先级:比如进程A急需,进程B可以等一会,那么就会先执行进程A

c)上下文:CPU的寄存器记录A进程在CPU执行到什么进度了,等操作系统调度完B进程回来,能够继续按A进程上次在CPU执行的进度继续下去.(类似于游戏存档读档).寄存器保存的就是这个进程运行过程中的进度,而保存上下文就是寄存器的值存在PCB中,恢复上下文就是把PCB中的值给寄存器恢复回去.

d)记账信息:操作系统统计每个进程在CPU上占用的时间和执行的数量,根据这个决定下一次如何调度

二、组织: 通过双向链表把多个PCB串到一起.

创建一个进程,其实是创建一个PCB结构体对象,并插入到链表中,销毁即把PCB节点删除掉,任务管理器看到的进程列表,其实是遍历这个PCB链表.

1.3 内存管理

前面提到“内存指针”,表示的是当前进程的内存有哪些,这里的指针指向的并非是一个真实的内存,而经过了一个抽象的过程构造出一个虚拟内存。

为了防止多个进程的内存之间相互干扰(比如“内存越界导致程序bug”),引用了“虚拟地址空间”,不再使用真实的物理地址,由操作系统和MMU硬件设备进行虚拟到物理地址的转换。当转换前的进程内存越界了,MMU就会转换失败,及时向进程反馈错误(SIGN SEGEMENT FAULT 导致进程崩溃)。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zZJbKRCK-1670414253949)(C:\Users\COFFEEWEN\AppData\Roaming\Typora\typora-user-images\image-20221206202849420.png)]

1.4 进程间通信

有些情况下,多个进程之间需要进行数据的交互,于是就有了进程间通信。进程间通信有多种实现方式,但核心思路是一样的,大概就是有一个“公共空间”,多个进程都可以访问。(就好比外卖柜,每个人都可以点外卖,外卖员 把外卖放进外卖柜,点单人再去外卖柜取。)

目前主流操作系统的进程通信机制有如下:

  1. 管道
  2. 共享内存
  3. 文件
  4. 网络
  5. 信号量
  6. 信号

2. 线程是什么

引入进程最主要的目的是为了解决"并发编程"问题,这也就意味着CPU进入到了多核心时代。前面提过电脑卡是因为CPU跑的线程过多导致的.那么增加了CPU的核心就可以完全解决卡顿问题吗?其实并不是,只有进程的话,进程的创建销毁和调度开销太大(消耗资源多,速度慢),为了进一步提高性能,于是引入了"线程 “【也叫"轻量级进程”:节省了创建/销毁资源】

“线程”:一个线程就是一个"执行流",每个线程按照顺序执行自己的代码,多个线程之间可以"同时"执行多份代码.

一个进程最少包含一个(主线程)或多个"线程",每个线程有自己的执行任务的逻辑(执行流),在一个进程里的线程共享一个内存空间,而线程是操作系统调度的分配单位. 一个线程也是通过一个PCB来描述的(前面说的进程都是建立在一个进程里只有一个线程来讲的.),一个进程里就有可能对应着多个PCB.【节省了创建/销毁资源:只有当创建第一个线程时,开销跟创建一个进程是一样的,后续的线程创建和销毁,只是创建和销毁线程,并没有进行销毁/创建资源(线程多少会占用点资源的).从而也就节省了开销。】

抽象?来个栗子:

比如我家开了个加工厂,厂里有一套加工设备和一条物流线专门供应这个工厂进出货物。一个月后做的风生水起,这时候我想扩建一下,于是我就决定再加一个厂再进一套设备,再联系一条物流线。但是这样就很麻烦了,要找厂要找物流,于是我又决定干脆直接在原先的厂里再进一套加工设备,这样不就省了场地和物流吗?而在一个厂房里的多个加工设备是共享共用一个厂房里的资源。这就是所谓的一个进程里有多个线程,叫做“多线程”。而再开一个厂,这叫做“多进程”。 但是有个例外,当一个厂房里塞满了加工设备,这个时候并不一定能提高效率了,反而会变的慢。多个设备在一个厂房里共用一个资源,当A设备需要这个加工材料时,B设备正好也需要,于是就可能这两个设备“干起来了”,但是开多个厂就不会有这种现象。这种现象称为“线程安全问题” 其实还有很多的“线程安全问题”根本问题就是**“线程”之间是“抢占式”访问的。** 其中有一个问题就是:如果一个线程抛异常,可能导致整个进程出异常,也就是这个进程里的所有线程没了.所以 进程比线程安全,线程比进程效率高

3.进程和线程的区别

  • 进程:
  1. 创建、销毁、调度慢。
  2. 多个进程之间不共享同一个内存空间。
  3. 进程是体统分配资源的最小单位。
  • 线程:
  1. 创建、销毁、调度快。
  2. 一个进程里至少有一个线程(即主线程)或多个线程。
  3. 多个线程之间共享同一个内存空间。
  4. 线程是系统调度的最小单位。

线程虽然比进程轻量,但是人们还不满足,于是有了“线程池”(ThreadPool)和“携程”(Coroutine)

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐