文件的概念:
“文件”这个名词不陌生,什么是文件?
系统资源(内存、硬盘、一般设备、进程间通信的通道等)的一个抽象,对系统资源进行访问的一个通用接口。
采用这种“文件”的方式有什么好处?
对资源提供通用的操作接口,可以极大地简化系统编程接口的设计。既然文件是一个通用的接口,由于系统资源多种多样,是不是意味着文件类型也多种多样?
文件的类型:
常见的文件类型(可以通过文件来访问的系统资源)有:
普通文件:一般意义上的文件,作为数据存储在磁盘中,可以进行随机访问。Linux系统中的文件是面向字节的,文件的内容以字节为单位进行存储和访问。
目录:目录是一种特殊的文件,目录可以像普通文件一样打开、关闭以及进行相应的操作。
管道:管道是Linux中的一种进程间通信的机制。
设备文件:设备文件没有具体的内容,对设备文件的读写操作实际上与某个设备的输入输出操作关联在一起。
符号链接:符号链接的内容是指向另一个文件的路径。当对符号链接进行操作时,系统会根据情况将这个操作转移到它所指向的文件上去,而不是对它本身进行操作。
socket:socket也是一种进程间通信的方式,与管道不同的是,它们可以在不同的主机上进行通信,也就是网络通信。
既然有多个文件类型,是不是意味着在程序中有多种方式表示文件呢?实际编程中,如何表示文件?
文件及文件描述符概述:
内核如何区分和引用特定的文件呢?这里用到的就是一个重要的概念——文件描述符。对于 Linux 而言,所有对设备和文件的操作都使用文件描述符来进行的。文件描述符是一个非负的整数,它是一个索引值,并指向内核中每个进程打开文件的记录表。当打开一个现存文件或创建一个新文件时,内核就向进程返回一个文件描述符;当需要读写文件时,也需要把文件描述符作为参数传递给相应的函数。
通常,一个进程启动时,都会打开 3 个文件:标准输入、标准输出和标准出错处理。这3 个文件分别对应文件描述符为 0、 1 和 2 (也就是宏替换 STDIN_FILENO、STDOUT_FILENO 和 STDERR_FILENO)(一般文件从3开始)。
若要访问文件,而且调用write、read、open和close时,就必须用到文件描述符。
不带缓存的I/O操作:
主要用到6个函数——creat、open、read、write、lseek和close。
这里的不带缓冲指每一个函数都只调用系统的一个函数。
1.create:
int creat(const char *filename,mode_t mode) 【通过man 2 creat命令查看】
需要包含的头文件:
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
1、filename: 要创建的文件名(包含路径,没指定的话默认为当前路径,执行的程序放在哪儿,就是当前路径);
2、mode :
参数mode也可以采用数字的形式,使用5位来表示,如图所示。
设置ID时,数字1表示设置,数字0表示不设置。设置文件权限时,数字4表示读权限,数字2表示写权限,数字1表示执行权限,如果设置多项权限是求和即可。例如:要创建一个文件,不设置文件属主和属组的执行ID(0),文件属主有读、写和执行的权限(1+2+4=7),文件属组有读和执行的权限(1+4=5),其他用户没有任何权限(0)。则函数调用的形式如下所示:
creat("test", 00750);
3、如果文件成功创建,creat函数会返回一个文件描述符,以后对该文件的操作就可以通过这个文件描述符来进行了,否则返回-1,并将错误码存入errno之中。
// 1createfile.c (注意umask)
perror
errno:就是error number(错误号码),Linux系统中对各种常见的错误给了一个编号!当我们的函数执行错误时,函数会返回一个特定的errno,告诉我们函数哪儿错了,对一些常见的错误编号,然后对号入座!
但是errno就是一个int类型的数字,我们看到的只是一个数字,比如-37,看起来不太方便。有一种解决方案,提供了一个函数:perror:内部会读取errno然后转化成能够看得懂的字符串!(不需要传参!)
void perror(const char *s);
该函数的功能将错误信息打印到标准错误输出。调用该函数时,首先输出参数s所指向的字符串,然后输出“:”符号,最后根据变量errno的值输出错误信息,即将变量errno的值转换为相应的字符串后再进行输出。
2.open:
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
int open(const char *filename, int flags); 【通过man 2 open命令查看】
int open(const char *filename, int flags, mode_t mode);
其中,参数filename为要创建/打开的文件名,如果文件名中没有包含路径,默认情况下认为是在当前目录下;
flags:
flags可以取上面列出的一个值或几个值的组合,但O_RDONLY、O_WRONLY和O_RDWR中只选择一个。
如果使用了O_CREAT,需要使用参数mode来设置文件的访问权限,即采用open函数的第二种形式,mode可选的参数为表所示选项的组合。
3.close:
#include <unistd.h>
int close(int fd);
其中,参数fd为要关闭的文件描述符。调用close函数后,系统会将数据写入磁盘,然后释放文件所占用的资源。函数调用成功后,返回值为0,否则返回-1。
// 2openfile.c
4.read:
#include <unistd.h>
ssize_t read(int fd, void *buf, size_t count);
其中,参数fd为要读取数据的文件描述符;
参数buffer为内存缓冲区的首地址;
参数count为要读取的字节数。
read函数从指定的文件fd中读取count字节到缓冲区buffer之中,返回值为实际读取到的字节数,文件的读写位置随读取到的字节移动。
注:返回值ssize_t类型是linux内核用typedef重定义的一个类型(其实就是int),返回值表示成功读取的字节数。
如果返回0,表示已到达文件的结尾;如果读取过程中有错误发生则返回-1,并设置相应的错误码。
5.write:
#include <unistd.h>
ssize_t write(int fd, const void *buf, size_t count);
其中,参数fd为要写入数据的文件描述符;
参数buffer指向要写入文件的数据;
参数count为要写入的字节数。
write函数将buffer中的count字节数据写入到指定的文件fd中。返回值为实际写入的字节数,文件的读写位置随之移动;如果写入过程中有错误发生则返回-1,并设置相应的错误码,错误码的取值与read函数类似。
// 3write_read.c
6.lseek:
每个文件中都有一个指针,用来指向当前读写位置。通常打开的一个文件当前读写位置在文件的开头。文件指针随着读写操作的执行,当前位置不断变化。使用lseek函数可以操作文件指针,它的一般形式为:
off_t lseek(int fd, off_t offset, int whence);
其中,参数fd为文件描述符;参数offset为偏移量(很少使用),即每次读写操作之后所需移动字节数,这个值可正可负,正值表示向前移动,负值表示向后移动;参数whence用来设定位置的参考点,取值如下所示:
SEEK_SET:参考点为文件的开头,新的读写位置即为偏移量;
SEEK_CUR:参考点为文件指针的当前位置,新的读写位置为当前位置加上偏移量 SEEK_END:参考点为文件的结尾,新的读写位置为文件的大小加上偏移量。
注:函数调用成功后,返回当前的读写位置,调用过程中发生错误则返回-1,并设置相应的错误码。
lseek函数有几个比较特殊的使用方式,如下所示:
将读写位置移到文件的开头 lseek(int fd, 0, SEEK_SET);
将读写位置移到文件的结尾 lseek(int fd, 0, SEEK_END);
获取当前的读写位置 lseek(int fd, 0, SEEK_CUR);
// 3write_read.c