目录

前言:

回顾语言层面的文件

理解文件的预备知识

文件和磁盘

使用和认识系统调用函数


前言:

本文以及下篇文章,揭露的都是Linux中文件的奥秘,对于文件来说,初学Linux第一节课接触的就是文件,对于C语言,我们使用fopen可以打开文件,对于C++,我们可以使用ofstream可以打开文件,那么对于这么多打开文件的方式,难道每个不同的语言,我们都要单独去学习如何使用对应的函数吗?

当然不是,我们不妨回想最初学习的OS的结构图:

对于该结构,我们设想一个问题,文件属于哪里?

文件属于磁盘,而磁盘属于硬件,那么对于文件来说,我们能跨过OS直接操控文件吗?当然不可以,那么C语言提供的文件函数是否……?留个悬念。

现在就开始揭秘文件的神秘面纱吧!


回顾语言层面的文件

我们在C语言接触到的文件函数不知道同学们是否忘记了,如果忘记了,我们简单的回忆一下:

#include <stdio.h>
#include <stdlib.h>

int main()
{
    FILE* fp = fopen("log.txt","w");
    if(fp == NULL)
    {
        perror("fp");
        exit(1);
    }
    fclose(fp);
    return 0;
}

通过fopen打开文件,以w的形式对文件进行写入,对于文件操作熟悉的同学应该知道,w这个方式进行写入的话,默认是在当前目录进行写,并且,重复运行该程序,会覆盖原来的log.txt。

这是基本知识。

那么提问了:为什么系统知道要在当前目录创建文件或者是写文件呢?

这里不妨多说几句,如果我们想要在语言层面,深刻理解文件的话,是不太现实的,因为高级语言的函数肯定是和系统调用存在一定关联的,所以我们需要先回顾一下高级语言的文件操作。

那么回到最开始的问题,为什么系统知道要在当前目录创建文件呢?

我们回想,是谁运行的我们的代码?是谁打开的文件?我们?还是程序?如果是程序,程序的本质是什么?

程序的本质是进程

所以,本质上是进程打开的我们的文件,这是第一个我们需要注意的点。

那么在Linux中,我们还有一个创建文件的方式,除了使用函数,我们可以该指令:

创建文件,这是重定向符,这是我们所熟知的,那么为什么它可以重定向呢?

以及我们第一次创建之后,写入了文件,我们再次重定向一下,文件的内容就没有了,这是为什么呢?

以及,文件是不是由OS进行统一管理呢?

如果是由OS进行统一管理,那么如果管理的呢?这里答案是比较明显的,先描述再组织

对于这里的内容,我们都需要后面的知识作为补充来了解,所以,现在进入到预备知识部分。


理解文件的预备知识

文件和磁盘

在第一个大标题来说,我们已经知道我们使用高级语言的函数来调用OS后面的文件,那么高级语言的函数是如果调用文件的呢?

不出意外,它们是通过调用系统层面的函数来操纵文件的。所以本质来说,高级语言的文件操作函数都是通过封装系统调用的函数来实现文件操作的。

那么,我们能否直接通过系统调用,来实现文件操作呢?

使用和认识系统调用函数

先来简单的看上一段代码:

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdlib.h>

int main()
{
    int fd = open("test.txt",O_WRONLY | O_CREAT);

    if(fd < 0)
    {
        perror("open");
        exit(-1);
    }

    return 0;
}

这是系统层面的open函数,使用了两个宏O_WRONLY| O_CREAT,open函数的返回值是int等,查看文档看详细内容:

使用2号手册可以查看,2号手册也是代表的open是一个系统调用函数,并且一大堆的头文件,还是有点麻烦的,其次,open函数可以有三个函数参数,但是对于我们刚才的代码,为什么我们传的是类似于宏的|操作呢?

不卖关子,O_CREAT就是宏,其他也是,我们可以在2号手册里面查看许多宏。

对于O_WRONLY等,为什么我们要传两个宏的或操作呢?

这里提问:

void func(int a1,int a2,int a3,int a4...)

对于一个函数来说,如果参数的数目是可变的,我们不可能就一直这么写参数吧?

除了C++的可变模板参数可以解决,Linux中我们怎么解决呢?或着说,源码里面是怎么解决的?

我们看一段代码就知道了:

void Func(int a)
{
    if(a&&ONE)
    printf("ONE\n");

    if(a&&TWO)
    printf("TWO\n");

    if(a&&THREE)
    printf("THREE\n");

}

int main()
{
    Func(ONE);
    Func(ONE | THREE);
    Func(ONE | TWO);
    return 0;
}

那么,我们可以将printf换成其他功能,这就是源码里面的操作,其中的参数flags,就叫做标记位。

第三个参数就好说了,就是权限而已,但是呢,我们先不带权限创建了文件之后,看看权限是什么呢?

ll之后,test甚至都标红了,前面的权限呢?就变成乱码了。这是因为我们没有设置。

所以相对来说呢,两个参数的open更多是用于已经创建好的文件进行操作的。

int main()
{
    int fd = open("test.txt",O_WRONLY | O_CREAT,0666);
    if(fd < 0)
    {
        perror("open");
        exit(-1);
    }
    return 0;
}

我们需要将原来的文件删除了之后,然后再设置即可.

但是有一个奇怪的现象,为什么test.txt的权限是664而不是666呢?相信对前文文件有所了解的话,就知道权限掩码,而系统中,存在一个函数,可以动态的修改掩码:

int main()
{
    umask(0);
    int fd = open("test.txt",O_WRONLY | O_CREAT | O_TRUNC,0666);
    if(fd < 0)
    {
        perror("open");
        exit(-1);
    }
    return 0;
}

此时权限就正常了,但是呢,系统中的掩码:

一看还是0002,难道不影响我们动态修改吗?

请记住,就近原则

现在引入3个问题:

1. fopen的w模式,是将文件创建,如果存在,就清空。那么我们先来看看这个宏:

int main()
{
    umask(0);
    int fd = open("test.txt",O_WRONLY | O_CREAT | O_TRUNC,0666);
    if(fd < 0)
    {
        perror("open");
        exit(-1);
    }
    return 0;
}

truncate的意思就是截断,使用起来和w是一样的:

此时文件清空。

那么:

宏O_TRUNC和w模式之间的关系是什么?

2.fd的返回值有345,但是没有012,0对应的是标准输入,键盘,1和2对应的硬件都是显示器,但是1是标准输入,2是标准错误。C语言中默认打开三个流。

返回值和C语言默认打开的流的联系究竟是什么呢?

3.宏还有O_APPEND,C语言中的函数fopen的a模式代表追加,APPEND的意思也是追加。

不同的宏与不同的模式之间的联系是什么呢?

预知后事如何~请看下篇~


感谢阅读!

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐