目录

一.磁盘相关概念

1.磁盘

2.磁道

3.扇区

4.盘面、柱面

5.磁盘的分类

二.磁盘调度算法

1.一次磁盘读/写操作需要的时间

2.先来先服务算法(FCFS)

3.最短寻找时间优先(SSTF)

4.扫描算法(SCAN)

5.LOOK调度算法

6.循环扫描算法(C-SCAN)

7.C-LOOK调度算法

三.减少延迟时间的方法

1.交替编号

2.错位命名

四.磁盘管理

1.磁盘初始化

2.引导块

3.坏块的管理


一.磁盘相关概念

1.磁盘

磁盘的表面由一些磁性物质组成,可以用这些磁性物质来记录二进制数据,如图所示,若要读取盘片中的二进制数据,就需要由磁头臂带动磁头移动,把“磁头”移动到想要读/写的扇区所在的磁道上,读取数据,磁头移动的方向为下图红色线来回方向

中间的马达可以带动磁盘转动,让目标扇区从磁头下面划过,才能完成对扇区的读/写操作。

2.磁道

一个磁盘的盘面被划分成一个个磁道这样的一个“圈”就是一个磁道,实际上磁盘的磁道数量非常多

3.扇区

一个磁道又被划分成一个个扇区,每个扇区就是一个“磁盘块”。各个扇区存放的数据量相同(如1KB),由于各个扇区存放的数据量相同,所以最内侧磁道上的扇区面积最小,因此数据密度最大

4.盘面、柱面

磁盘有多个盘片"摞"起来,如下图所示:每个盘面对应一个磁头,一个盘片可能会有两个盘面,所有的磁头都是连在同一个磁臂上的,因此所有磁头只能“共进退”

所有盘面中相对位置相同的磁道组成柱面

可用(柱面号,盘面号,扇区号)来定位任意一个“磁盘块”。在“文件的物理结构”中,我们提到文件数据存放在外存中的几号块,这个块号就可以转换成(柱面号,盘面号,扇区号)的地址形式。

可根据该地址读取一个“块”

①根据“柱面号”移动磁臂,让磁头指向指定柱面;
②激活指定盘面对应的磁头;

③磁盘旋转的过程中,指定的扇区会从磁头下面划过,这样就完成了对指定扇区的读/写。

5.磁盘的分类

磁头可以移动的称为活动头磁盘。磁臂可以来回伸缩来带动磁头定位磁道

磁头不可移动的称为固定头磁盘。这种磁盘中每个磁道有一个磁头 

盘片可以更换的称为可换盘磁盘 ,盘片不可更换的称为固定盘磁盘

二.磁盘调度算法

1.一次磁盘读/写操作需要的时间

(1)寻找时间(寻道时间)T_{s}:在读/写数据前,将磁头移动到指定磁道所花的时间。

启动磁头臂是需要时间的。假设耗时为s;
移动磁头也是需要时间的。假设磁头匀速移动,每跨越一个磁道耗时为m,总共需要跨越n条磁道。则:

寻道时间 T_{s}=s+ m*n

现在的硬盘移动一个磁道大约需要0.2ms,磁臂启动时间约为2ms

(2)延迟时间T_{R}:通过旋转磁盘,使磁头定位到目标扇区所需要的时间。

设磁盘转速为r(单位:转/秒,或转/分),则平均所需的延迟时间

T_{R}=(1/2)*(1/r)= 1/2r

注:1/r 就是转一圈需要的时间。找到目标扇区平均需要转半圈,因此再乘以 1/2,磁盘的转速越高,延迟时间越短,磁盘读写速度越快.

硬盘的典型转速为5400 转/分,或7200转/分

(3)传输时间T_{t}:从磁盘读出或向磁盘写入数据所经历的时间

假设磁盘转速为r,此次读/写的字节数为b,每个磁道上的字节数为 N。则:

传输时间T_{t}=(1/r)*(b/N)= b/(rN)

注:每个磁道要可存 N字节的数据,因此b字节的数据需要 b/N 个磁道才能存储。而读/写一个磁道所需的时间刚好又是转一圈所需要的时间 1/r

总的平均存取时间就是三者加在一起: T=T_{s}+ 1/2r+ b/(rN)

延迟时间和传输时间都与磁盘转速相关,且为线性相关。而转速是硬件的固有属性,因此操作系统也无法优化延迟时间和传输时间,唯一能改变的是寻找时间,可以通过磁盘调度算法映像寻道时间

总结:

2.先来先服务算法(FCFS)

根据进程请求访问磁盘的先后顺序进行调度。

假设磁头的初始位置是100号磁道,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道

按照FCFS的规则,按照请求到达的顺序,磁头需要依次移动到55、58、39、18、90、160、150、38、184号磁道

磁头总共移动了 45+3+19+21+72+70+10+112+146=498个磁道

处理的请求数为9,响应一个请求平均需要移动 498/9=55.3个磁道(平均寻找长度)

优点:公平;如果请求访问的磁道比较集中的话,算法性能还算过的去

缺点:女如果有大量进程竞争使用磁盘,请求访问的磁道很分散,则FCFS在性能上很差,寻道时间长

3.最短寻找时间优先(SSTF)

SSTF 算法会优先处理的磁道是与当前磁头最近的磁道。可以保证每次的寻道时间最短,但是并不能保证总的寻道时间最短。(其实就是贪心算法的思想,只是选择眼前最优,但是总体未必最优)

假设磁头的初始位置是100号磁道,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道

按照SSTF算法会优先处理离当前磁头最近的磁道,访问顺序如下图所示:

磁头总共移动了(100-18)+(184-18)=248个磁道

响应一个请求平均需要移动 248/9=27.5 个磁道(平均寻找长度)

优点:性能较好,平均寻道时间短

缺点:可能产生“饥饿”现象,产生饥饿的原因在于:磁头在一个小区域内来回来去地移动

 例如,本例中,如果在处理18号磁道的访问请求时又来了一个38号磁道的访问请求,处理38号磁道的访问请求时又来了一个18号磁道的访问请求。如果有源源不断的18号、38号磁道的访问请求到来的话,150、160、184号磁道的访问请求就永远得不到满足,从而产生“饥饿”现象。

4.扫描算法(SCAN)

SSTF算法会产生饥饿的原因在于:磁头有可能在一个小区域内来回来去地移动。为了防止这个问题可以规定,只有磁头移动到最外侧磁道的时候才能往内移动,移动到最内侧磁道的时候才能往外移动。这就是扫描算法(SCAN)的思想。由于磁头移动的方式很像电梯,因此也叫电梯算法。

假设某磁盘的磁道为 0~200号,磁头的初始位置是100号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道

按照SCAN算法的要求,磁头必须先移动到最外侧,才能往内侧移动

磁头总共移动了(200-100)+(200-18)=282个磁道

响应一个请求平均需要移动282/9=31.3个磁道(平均寻找长度)

这个算法的平均寻道时间比先来先服务算法短得多,虽然不比最短寻找时间优先算法,但他不会产生饥饿,所以:

优点:性能较好,平均寻道时间较短,不会产生饥饿现象

缺点:

只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了184号磁道的访问请求之后就不需要再往右移动磁头了。

②SCAN算法对于各个位置磁道的响应频率不平均(如:假设此时磁头正在往右移动,且刚处理过90号磁道,那么下次处理90号磁道的请求就需要等磁头移动很长一段距离;而响应了184号磁道的请求之后,很快又可以再次响应184号磁道的请求了)

5.LOOK调度算法

扫描算法(SCAN)中,只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了184号磁道的访问请求之后就不需要再往右移动磁头了。LOOK 调度算法就是为了解决这个问题,如果在磁头移动方向上已经没有别的请求,就可以立即改变磁头移动方向。(边移动边观察,因此叫 LOOK)

假设某磁盘的磁道为0~200号,磁头的初始位置是100号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道

磁头总共移动了(184-100)+(184-18)=250个磁道

响应一个请求平均需要移动 250/9=27.5个磁道(平均寻找长度)

优点:比起SCAN 算法来,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短

6.循环扫描算法(C-SCAN)

SCAN算法对于各个位置磁道的响应频率不平均,而C-SCAN 算法就是为了解决这个问题。规定只有磁头朝某个特定方向移动时才处理磁道访问请求,而返回时直接快速移动至起始端而不处理任何请求。

假设某磁盘的磁道为 0~200号,磁头的初始位置是100号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道

磁头总共移动了(200-100)+(200-0)+(90-0)=390 个磁道

响应一个请求平均需要移动 390/9=43.3个磁道(平均寻找长度)

优点:比起SCAN 来,对于各个位置磁道的响应频率很平均。

缺点:与SCAN算法相同,只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了184号磁道的访问请求之后就不需要再往右移动磁头了;并且,磁头返回时其实只需要返回到18号磁道即可,不需要返回到最边缘的磁道。另外,比起SCAN算法来,平均寻道时间更长。

7.C-LOOK调度算法

C-SCAN 算法的主要缺点是只有到达最边上的磁道时才能改变磁头移动方向,并且磁头返回时不一定需要返回到最边缘的磁道上。C-LOOK 算法就是为了解决这个问题。如果磁头移动的方向上已经没有磁道访问请求了,就可以立即让磁头返回,并且磁头只需要返回到有磁道访问请求的位置即可。

假设某磁盘的磁道为 0~200号,磁头的初始位置是100号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道

磁头总共移动了(184-100)+(184-18)+(90-18)=322 个磁道

响应一个请求平均需要移动 322/9=35.8个磁道(平均寻找长度)
优点:比起C-SCAN 算法来,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短

注:若题目中无特别说明,则SCAN 就是 LOOK,C-SCAN 就是C-LOOK,也就是只要在磁头移动方向上不再有请求,就立即改变磁头方向

三.减少延迟时间的方法

通过旋转磁盘,使磁头定位到目标扇区所需要的时间。

假设要连续读取橙色区域的 2、3、4扇区:磁头读取一块的内容(也就是一个扇区的内容)后,需要一小段时间处理,而盘片又在不停地旋转,如图所示,虽然磁头会划过3号扇区,但是此时还在还需要时间处理,并不能立即访问3号扇区

因此,如果2、3号扇区相邻着排列,则读完2号扇区后,无法连续不断地读入3号扇区,必须等盘片继续旋转,3号扇区再次划过磁头,才能完成扇区读入.所以,磁头读入一个扇区数据后需要一小段时间处理,如果逻辑上相邻的扇区在物理上也相邻,则读入几个连续的逻辑扇区,可能需要很长的“延迟时间,可以使用交替编号的方法

1.交替编号

若采用交替编号的策略,即让逻辑上相邻的扇区在物理上有一定的间隔,可以使读取连续的逻辑扇区所需要的延迟时间更小。

若此时读取3号扇区后,想要读取0号扇区,读取0号扇区前,磁头已经做好了下一次读取数据的准备,因此随着磁盘的旋转,磁头也可以划过0号扇区,读取0号扇区数据

为什么磁盘的物理地址是(柱面号,盘面号,扇区号)而不是(盘面号,柱面号,扇区号)

假设某磁盘有8个柱面/磁道(假设最内侧柱面/磁道号为0),4个盘面,8个扇区。则可用3个二进制位表示柱面,2个二进制位表示盘面,3个二进制位表示扇区。

① 若物理地址结构是(盘面号,柱面号,扇区号),且需要连续读取物理地址(00,000,000)~(00,001,111)的扇区;

(00,000,000)~(00,000,111)转两圈可读完

之后再读取物理地址相邻的区域,即(00,001,000)~(00,001,111),需要启动磁头臂,将磁头移动到下一个磁道

② 若物理地址结构是(柱面号,盘面号,扇区号),且需要连续读取物理地址(000,00,000)~(000,01,111)的扇区:

(000,00,000)~(000,00,111)由盘面0的磁头读入数据,之后再读取物理地址相邻的区域,即(000,01,000)~(000,01,111),由于柱面号/磁道号相同只是盘面号不同,因此不需要移动磁头臂。只需要激活相邻盘面的磁头即可

所以:读取地址连续的磁盘块时,采用(柱面号,盘面号,扇区号)的地址结构可以减少磁头移动消耗的时间

2.错位命名

若相邻的盘面相对位置相同处扇区编号相同,由于磁盘的物理地址采用的是(柱面号,盘面号,扇区号),若要读取0号盘面(000,00,111),其中111是2进制,转为10进制就是0号盘面的7号扇区,而1号盘面则需读取(000,01,000),即1号盘面的0号扇区

如下图所示,读取完磁盘块(000,00,111)之后,需要短暂的时间处理,而盘面又在不停地转动,因此当(000,01,000)第一次划过1号盘面的磁头下方时,并不能读取数据,只能再等该扇区再次划过磁头,为了解决这一问题,可以使用错位命名

如图所示,0号盘面的1号扇区对应1号盘面的4号扇区,若现在依然要读取0号盘面(000,00,111),1号盘面则需读取(000,01,000),由于采用错位命名法,因此读取完磁盘块(000,00,111)之后,还有一段时间处理,当(000,01,000)第一次划过1号盘面的磁头下方时,已经处理完0号盘面的数据了,就可以直接读取数据。从而减少了延迟时间

四.磁盘管理

1.磁盘初始化

第一步:进行低级格式化(物理格式化),将磁盘的各个磁道划分为扇区。一个扇区通常可分为头、数据区域(如512B大小)、尾 三个部分组成。管理扇区所需要的各种数据结构一般存放在头、尾两个部分,包括扇区校验码(如奇偶校验、CRC循环几余校验码等,校验码用于校验扇区中的数据是否发生错误)

第二步:将磁盘分区,每个分区由若干柱面组成(即分为我们熟悉的 C盘、D盘、E盘)

第三步:进行逻辑格式化,创建文件系统。包括创建文件系统的根目录、初始化存储空间管理所用的数据结构(如位示图、空闲分区表)

2.引导块

计算机开机时需要进行一系列初始化的工作,这些初始化工作是通过执行初始化程序(自举程序)完成的,初始化程序可以放在ROM (只读存储器)中。ROM中的数据在出厂时就写入了,并且以后不能再修改,计算机开机时,会读取ROM中的相应程序完成初始化工作

注:ROM一般是出厂时就集成在主板上的

若初始化程序程序(自举程序)放在ROM中存在什么问题?

万一需要更新自举程序,将会很不方便,因为ROM中的数据无法更改。如何解决呢?

ROM中只存放很小的"自举装入程序",完整的自举程序放在磁盘的启动块(即引导块/启动分区)上,启动块位于磁盘的固定位置。

自举装入程序很小,所以能够保证不改变,拥有启动分区的磁盘称为启动磁盎或系统磁盘(C:盘)
开机时计算机先运行ROM中的“自举装入程序”,通过执行该程序CPU就可知道引导块在磁盘的哪个位置,并找到引导块,将完整的“自举程序”读入内存,完成初始化

3.坏块的管理

坏了、无法正常使用的扇区就是“坏块”。这属于硬件故障,操作系统是无法修复的。应该将坏块标记出来,以免错误地使用到它

对于简单的磁盘,可以在逻辑格式化时(建立文件系统时)对整个磁盘进行坏块检查,标明哪些扇区是坏扇区,比如:在FAT(文件分配表)表上标明。(在这种方式中,坏块对操作系统不透明)

操作系统在对存储空间进行管理时,一定要访问FAT表中,而坏块会在FAT表上标明

对于复杂的磁盘,磁盘控制器(磁盘设备内部的一个硬件部件)会维护一个坏块链表

在磁盘出厂前进行低级格式化(物理格式化)时就将坏块链进行初始化。

同时会保留一些“备用扇区”,用于替换坏块。这种方案称为扇区备用。且这种处理方式中,坏块对操作系统透明,即操作系统不可知

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐