前言
在上一篇博客中,本人提到了自己的文件操作可以说是几乎没用过。现在想想,这也算是只在OJ上做题的一个弊端吧。虽然通过OJ做题是一个学习代码好手段,但其他方面也要多多涉猎才好,而不是说OJ用不到文件操作,就不去使用了,要坚持贯彻Learning by doing(咳)。写完上一篇博文之后,偷懒了三天,今天我就花时间学习了上次的不足,也就是这第二篇博客的标题。
C语言的文件操作
在编码过程中,尤其是在初学时,控制台和命令行是我们打交道的对象。有时候学了很久的代码,打出来的程序也只能是和小黑框交互,从键盘输入再看结果。面对着黑框框,我们也许会有疑问,我们怎样做点更高级的事情?这不,跟文件的操作是我们必须要熟悉的。
下面回答一个问题:
学过了C语言,你明白文件和流的区别和联系吗?如何区分文本文件和二进制文件?如何编程操作这两种文件?
文件是什么?
文件(file)通常是磁盘上一段命名的存储区。比如stdio.h就是一个包含一些有用信息的文件的名称。对于操作系统来说文件就会更复杂一些……您需要考虑的是如何在C程序中处理文件。
——《C Primer Plus》P354
在计算机中,有很多计算机文件。是以计算机硬盘为载体的存储在计算机上的信息的集合。文件的类型很多,例如word文档、txt文件、图像、可执行程序等。文件通常有几个字母组成的扩展名,来指示文件类型。
什么是流?(stream)
接触C++,我们会知道有这么一行代码:
#include <iostream>
通过学习,我们会知道iostream是“输入输出流”的意思,也就是in(入)、out(出)、stream(流)三个单词的组合。我们知道有I\O,那么stream到底是个什么东西?
C++程序把输入和输出看做字节流。输入时,程序从输入流中抽取字节;输出时,程序将字节插入流中。对于面向文本的程序,那么每个字节代表一个字符。输入流的字节可能来自键盘,也可能来自存储设备(如硬盘)或其他程序。同样,输出流中的字节可以流向屏幕、打印机、存储设备和其他输出设备或程序。流充当了程序和流源或目标之间的桥梁。——《C++ Primer Plus》P732
它们之间的联系是什么?
我觉得上面的这句话“流充当了程序和流源或目标之间的桥梁”讲得非常好,同时书上还举了一些比较具体的例子方便我理解,这里我就不详尽地复述了。
再通过搜素他人的博客(C++ 流(stream)总结)进行学习。
C++中把数据之间的传输操作称为流
以下是我个人的理解:几乎所有程序都需要输入和输出,也就需要数据的传递。比如一个程序从输入中获取数据,再发送一些数据给输出设备。传递着的数据,就像水流一样,所以用stream这个单词来描述很恰当,同时也很形象生动,中文的话就用流来简称。
举个例子,fgets函数,原型为
char *fgets(char *buf, int bufsize, FILE *stream);
第三个参数的名字就是stream,流(还记得好的变量名能够给人以提示的作用吗)。调用fgets函数时,第三个参数可以写stdin,也就是标准输入,通常是指键盘输入。当然也可以写一个FILE指针,就是从文件读入数据了。这里流的作用就是把这个输入的数据的去向和函数(程序)关联起来。可以把这种数据看做水一样,流就是数据的载体。
文本文件和二进制文件
可以参考这篇博客:文本文件和二进制文件的区别
下面是编程操作的过程!
写一个程序,统计代码的行数
方法一,比较简单,但没有文件操作是一个缺点,需要复制代码进小黑框看结果。但解决问题的基本思路可以在这个代码里看出来,就是统计\n的数量有多少。
#include<stdio.h>
int main()
{
char c;
int count = 0;
while ((c = getchar()) != EOF)
{
if (c == '\n')
count++;
}
printf("%d\n", count);
return 0;
}
下面介绍几个跟此任务有关的文件操作的知识:
1. FILE *fp是什么?
基本上写C语言的文件操作都有这么一行,但我想更深一步的知道这行语句的作用是什么,于是在搜索引擎中搜索FILE得到以下结果:
C语言中FILE在"stdio.h"中有如下定义
struct _iobuf {
char *_ptr; //文件输入的下一个位置
int _cnt; //当前缓冲区的相对位置
char *_base; //指基础位置(即是文件的其始位置)
int _flag; //文件标志
int _file; //文件的有效性验证
int _charbuf; //检查缓冲区状况,如果无缓冲区则不读取
int _bufsiz; //缓冲区的大小
char *_tmpfname; //临时文件名
};
typedef struct _iobuf FILE;
观察代码之后就能比较容易的理解了。简单来说C语言中定义了一个结构体,所以说白了FILE也是一种变量类型。有了FILE * fp语句之后,fp是一个FILE 类型指针。很多跟文件有关操作的参数or返回值就是FILE * 类型的。
2. fopen
是一个比较重要的函数。 函数原型:
FILE * fopen(const char * path,const char * mode);
返回值:文件顺利打开后,指向该流的文件指针就会被返回。如果文件打开失败则返回NULL,并把错误代码存在errno中。
第一个参数是要打开文件的文件名指针,一般用双引号括起来的文件名表示,也可使用双反斜杠隔开的路径名。第二个参数是指打开的方式 主要有以下几种:
模式字符串 | 意义 |
---|---|
"r" | 只读 |
"w" | 指针指到文件头,只写。如果文件不存在会创建文件。用任意的"w"模式打开一个已有的文件,会清空其内容。 |
"a" | 指针指到文件尾,也就是可以向已有文件的尾部追加内容。如果文件不存在会创建文件。 |
"r+" | 打开一个已存在的文件,可以读or写 |
"w+" | 打开一个已存在的文件,可以读or写,如果文件不存在会创建文件。如果已有则会清空内容。 |
"a+" | 打开一个已存在的文件,可以读or写,向已有文件尾部追加内容。如果文件不存在会创建文件。可以读取整个文件,但写入时只能追加内容。 |
"rb","wb","ab","rb+","wb+","ab+" | 与前面的模式相似,区别是:前面六个操作的对象是文本文件,而这六个是操作二进制文件。 |
具体用法举例:
FILE *fp;
fp = fopen("test.txt","r");
3. 如何从文本中读取字符?fgetc函数
int fgetc(FILE *stream);
意为从文件指针stream指向的文件中读取一个字符,读取一个字节后,光标位置后移一个字节。
这个函数的返回值,是返回所读取的一个字节。如果读到文件末尾或者读取出错时返回EOF。所以可以看出,这里使用while语句,可以从头到尾扫描一个文件的字符。
4.fclose
int fclose(FILE * stream);
函数关闭由指针fp指定的文件。注意:使用fclose()函数就可以把缓冲区内最后剩余的数据输出到内核缓冲区,并释放文件指针和有关的缓冲区。
返回值:成功关闭文件,返回0,否则返回EOF。
这个统计代码行数的任务,只需要用到上面提到的几个文件操作,就可以写出对文件进行统计的程序代码了。是不是很简单呢?
在dev C++中运行结果正常,附上结果图一张:
我平时喜欢用Microsoft Visual Studio 2015 Community。在此IDE下fopen函数有报错。信息如下:
错误 C4996 'fopen': This function or variable may be unsafe.Consider using fopen_s instead.
看一下fopen_s的函数原型:
什么是fopen_s? errno_t又是什么?
搜索引擎搜索fopen_s函数,出现如下的实例代码:
//This program opens two files.It uses
//fclose to close the first file and
//_fcloseall to close all remaining files.
#include<stdio.h>
FILE *stream, *stream2;
int main(void)
{
errno_t err;
//Open for read(will fail if file "crt_fopen_s.c" does not exist)
err = fopen_s(&stream, "crt_fopen_s.c", "r");
if (err == 0)
{
printf("The file 'crt_fopen_s.c'was opened\n");
}
else
{
printf("The file 'crt_fopen_s.c'was not opened\n");
}
//Open for write
err = fopen_s(&stream2, "data2", "w+");
if (err == 0)
{
printf("The file 'data2'was opened\n");
}
else
{
printf("The file 'data2'was not opened\n");
}
//Close stream if it is not NULL
if (stream)
{
err = fclose(stream);
if (err == 0)
{
printf("The file 'crt_fopen_s.c' was closed\n");
}
else
{
printf("The file 'crt_fopen_s.c' was not closed\n");
}
}
//All other files are closed:
int numclosed = _fcloseall();
printf("Number of files closed by _fcloseall:%u\n", numclosed);
}
阅读以上代码可以得知:
errno_t也是一种类型,基本上是用来判断文件的打开和关闭的成功与否,0为成功的打开或关闭了文件。
fopen_s的功能和fopen大致一样,区别有:返回值类型是errno_t而不是FILE * ;有三个参数;第一个参数类型是FILE **。
改进版本
根据以上信息可以比较轻松地完成debug,简单的替换函数即可。
如果要累计各个文件总共的代码行数只需在程序中把int count = 0; 这一语句改成
static int count = 0;
即可。最后的运行情况是:
结果也是正确的!
附上改进版本的github链接。
后记
关于对Github的使用的学习,这里我参考了学长schaepher的博客 ,在此深表感谢!!
任何有错误的地方,或者有疑惑都欢迎和我交流。