【面试问题】进程和线程的区别——通俗易懂
在对比"进程"和"线程"两者之间的区别前,我们需要先了解什么是"进程"?什么是"线程"?**“进程”(process)也叫"任务"(task)**即咱们电脑的任务管理器中有个进程页面,这个页面所展示的都是电脑里正在运行的一些进程.只有当一个程序跑起来了,才能叫"进程",否则不算是"进程",像电脑磁盘里放着一些文件、可执行程序等等这些都不能算是进程!一个系统在同一时刻可以跑多个进程,每个进程都会消耗
1. ”进程“是什么
在对比"进程"和"线程"两者之间的区别前,我们需要先了解什么是"进程"?什么是"线程"?
“进程”(process)也叫"任务"(task) 即咱们电脑的任务管理器中有个进程页面,这个页面所展示的都是电脑里正在运行的一些进程.只有当一个程序跑起来了,才能叫"进程",否则不算是"进程",像电脑磁盘里放着一些文件、可执行程序等等这些都不能算是进程!
一个系统在同一时刻可以跑多个进程,每个进程都会消耗一些资源CPU,内存,磁盘,网络…所以当进程多了电脑了就卡了呗.(有的人说是C盘东西多了,电脑卡清一清就没事了,其实也跟这个有一定关联,当你把软件卸了,对应着"进程"也就没了.因此电脑卡的本质就是同一时刻进程数量太多,CPU扛不住了~.那么这个时候就有大聪明说了:“那我在网上下载的学习资料,会不会导致电脑卡呢”?一般来说是不会卡的,因为下载后它只是一个程序,并没有运行起来,不过当你把学习资料打开了俺就不知道卡不卡咯<=_<=)因此"进程"是操作系统资源的分配单位,"进程"是由操作系统内核负责管理.
1.2 管理进程
“进程"是一个重要的"软件资源”,**是由操作系统内核负责管理的.**这里的管理分两部分:描述,组织.
所谓描述即有哪些属性和特征;组织即通过一定的数据结构把多个这样的基本单位(进程)串起来.
一、描述: 使用结构体(C语言)描述"进程"属性,这个结构体有个特殊的名字**“PCB”(进程控制块);**
- 进程持有哪些硬件资源:
a)pid:进程的身份标识符(唯一数字).
b)内存指针: 指向了当前对象的内存是哪些.(分配内存)
c)文件描述附表: 硬盘文件等其他资源.
以上资源都比较好分配,不好分配的资源"CPU",我们看到在任务管理器上跑着上百个"进程",而CPU只有一个(现在都是多核心CPU),为了能够保证这些进程能"同时运行",“分时复用”,于是涉及到以下两个概念:
并行: 微观上同一时刻,两个核心上的进程,用时执行.
并发: 微观上,同一时刻,一个核心只能运行一个进程,但是它能够对多个进程之间进行超快速的切换.我们看起来好像是在同时运行.
“并行"和"并发"往往统称为"并发”.因此并发解决了多个进程运行.而为了分配有限的CPU,操作系统提供了一个调度器模块,来负责调度CPU执行这么多个进程.而引入进程就是为了解决"并发编程"问题.
-
进程调度的相关属性:
a)进程的状态:
就绪状态:随时准备去cpu执行
运行状态: 正在执行
阻塞状态: 一个进程短时间内无法响应.
b)优先级:比如进程A急需,进程B可以等一会,那么就会先执行进程A
c)上下文:CPU的寄存器记录A进程在CPU执行到什么进度了,等操作系统调度完B进程回来,能够继续按A进程上次在CPU执行的进度继续下去.(类似于游戏存档读档).寄存器保存的就是这个进程运行过程中的进度,而保存上下文就是寄存器的值存在PCB中,恢复上下文就是把PCB中的值给寄存器恢复回去.
d)记账信息:操作系统统计每个进程在CPU上占用的时间和执行的数量,根据这个决定下一次如何调度
二、组织: 通过双向链表把多个PCB串到一起.
创建一个进程,其实是创建一个PCB结构体对象,并插入到链表中,销毁即把PCB节点删除掉,任务管理器看到的进程列表,其实是遍历这个PCB链表.
1.3 内存管理
前面提到“内存指针”,表示的是当前进程的内存有哪些,这里的指针指向的并非是一个真实的内存,而经过了一个抽象的过程构造出一个虚拟内存。
为了防止多个进程的内存之间相互干扰(比如“内存越界导致程序bug”),引用了“虚拟地址空间”,不再使用真实的物理地址,由操作系统和MMU硬件设备进行虚拟到物理地址的转换。当转换前的进程内存越界了,MMU就会转换失败,及时向进程反馈错误(SIGN SEGEMENT FAULT 导致进程崩溃)。
1.4 进程间通信
有些情况下,多个进程之间需要进行数据的交互,于是就有了进程间通信。进程间通信有多种实现方式,但核心思路是一样的,大概就是有一个“公共空间”,多个进程都可以访问。(就好比外卖柜,每个人都可以点外卖,外卖员 把外卖放进外卖柜,点单人再去外卖柜取。)
目前主流操作系统的进程通信机制有如下:
- 管道
- 共享内存
- 文件
- 网络
- 信号量
- 信号
2. 线程是什么
引入进程最主要的目的是为了解决"并发编程"问题,这也就意味着CPU进入到了多核心时代。前面提过电脑卡是因为CPU跑的线程过多导致的.那么增加了CPU的核心就可以完全解决卡顿问题吗?其实并不是,只有进程的话,进程的创建销毁和调度开销太大(消耗资源多,速度慢),为了进一步提高性能,于是引入了"线程 “【也叫"轻量级进程”:节省了创建/销毁资源】
“线程”:一个线程就是一个"执行流",每个线程按照顺序执行自己的代码,多个线程之间可以"同时"执行多份代码.
一个进程最少包含一个(主线程)或多个"线程",每个线程有自己的执行任务的逻辑(执行流),在一个进程里的线程共享一个内存空间,而线程是操作系统调度的分配单位. 一个线程也是通过一个PCB来描述的(前面说的进程都是建立在一个进程里只有一个线程来讲的.),一个进程里就有可能对应着多个PCB.【节省了创建/销毁资源:只有当创建第一个线程时,开销跟创建一个进程是一样的,后续的线程创建和销毁,只是创建和销毁线程,并没有进行销毁/创建资源(线程多少会占用点资源的).从而也就节省了开销。】
抽象?来个栗子:
比如我家开了个加工厂,厂里有一套加工设备和一条物流线专门供应这个工厂进出货物。一个月后做的风生水起,这时候我想扩建一下,于是我就决定再加一个厂再进一套设备,再联系一条物流线。但是这样就很麻烦了,要找厂要找物流,于是我又决定干脆直接在原先的厂里再进一套加工设备,这样不就省了场地和物流吗?而在一个厂房里的多个加工设备是共享共用一个厂房里的资源。这就是所谓的一个进程里有多个线程,叫做“多线程”。而再开一个厂,这叫做“多进程”。 但是有个例外,当一个厂房里塞满了加工设备,这个时候并不一定能提高效率了,反而会变的慢。多个设备在一个厂房里共用一个资源,当A设备需要这个加工材料时,B设备正好也需要,于是就可能这两个设备“干起来了”,但是开多个厂就不会有这种现象。这种现象称为“线程安全问题” 其实还有很多的“线程安全问题”根本问题就是**“线程”之间是“抢占式”访问的。** 其中有一个问题就是:如果一个线程抛异常,可能导致整个进程出异常,也就是这个进程里的所有线程没了.所以 进程比线程安全,线程比进程效率高
3.进程和线程的区别
- 进程:
- 创建、销毁、调度慢。
- 多个进程之间不共享同一个内存空间。
- 进程是体统分配资源的最小单位。
- 线程:
- 创建、销毁、调度快。
- 一个进程里至少有一个线程(即主线程)或多个线程。
- 多个线程之间共享同一个内存空间。
- 线程是系统调度的最小单位。
线程虽然比进程轻量,但是人们还不满足,于是有了“线程池”(ThreadPool)和“携程”(Coroutine)
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)