【c的文件操作】文本文件和二进制文件(内存映像)的不同 文件结尾判断feof , EOF

时间:2021-10-05 17:25:02

查看 stdio.h 可以看到如下定义:

#define  EOF  (-1)

#define  _IOEOF  0x0010 
#define  feof(_stream)  ((_stream)->_flag & _IOEOF)

由此可以看出,这两种方式的原理是不同的。

在这里先说下EOF和feof()这个两个宏定义,在我们学的课本中有这样的描述。

EOF是不可输出字符,因此不能在屏幕上显示。由于字符的ASCII码不可能出现-1,因此EOF定义为-1是合适的。当读入的字符值等于EOF时,表示读入的已不是正常的字符而是文件结束符,但这适用对文本文件的读写。在二进制文件中,信息都是以数值方式存在的。EOF的值可能就是所要处理的二进制文件中的信息。这就出现了需要读入有用数据却被处理为“文件结束“的情况。为了解决这个问题,C提供了一个feof()函数,可以用它来判断文件是否结束。feof(fp)用于测试fp所指向的文件的当前状态是否为“文件结束”。如果是,函数则返回的值是1(真),否则为0(假)。

说了这两个的定义,肯定还对二进制文件和文本文件的区别有些模糊(唉,因为我当时就对这些搞不懂),那现在就回顾下这两个文件的概念。C语言支持的是流式文件,它把文件看作由一个一个的字符(字节)数据组成的序列。根据数据的组织和操作形式,可以分为ASCII文件和二进制文件。

ASCII文件又称为文本文件,它是在一个字节的存储单元上存放一个字符(在外存中存放的是该字符的ASCII码,每个字符将占一个字节)。

二进制文件是把内存中的数据按其在内存中的存储格式在磁盘上原样保存。

对字符而言,由于其外存存储格式和内存表示格式相同,所以,在外存上也存放每个字符的ASCII码。

但是说EOF只能用于文本文件,其实不然,这点不是特别的准确,还要看定义的变量的类型。

下面这段程序对文本文件和二进制文件都可以:

int c;
while((c=fgetc(fp)) != EOF)
{
printf("%X/n", c); 
}
如果读到了FF,由于c定义为int型,所以实际上c=0x000000FF,不等于EOF(-1=0xFFFFFFFF),因此不会误判为文件结尾。

但是如果把c定义为char类型,就有可能产生混淆了。
char c;
while((c=fgetc(fp)) != EOF)
{
printf("%X/n", c); 
}
因为文本文件中存储的是ASCII码,而ASCII码中FF代表空值(blank),一般不使用,所以如果读文件返回了FF,说明已经到了文本文件的结尾。但是如果是二进制文件,其中可能会包含FF,因此不能把读到EOF作为文件结束的条件,此时只能用feof()函数。

在VC里,只有当文件位置指针(fp->_ptr)到了文件末尾,然后再发生读/写操作时,标志位(fp->_flag)才会被置为含有_IOEOF。然后再调用feof(),才会得到文件结束的信息。

对于feof()这个函数, 它是先读再判断是否到文件尾, 也就是说在它之前一定要读一次才能做出判断。

因此,如果运行如下程序:
char c;
while(!feof(fp))
{
c = fgetc(fp);
printf("%X/n", c); 
}
会发现多输出了一个FF,原因就是在读完最后一个字符后,fp->flag仍然没有被置为_IOEOF,因而feof()仍然没有探测到文件结尾。直到再次调用fgetc()执行读操作,feof()才能探测到文件结尾。这样就多输出了一个-1(即FF)。它是先判断==>再读(可能这时就是文件尾了, 读不出东西了)

正确的写法应该是:
char c;
c = fgetc(fp);
while(!feof(fp))
{
printf("%X/n", c); 
c = fgetc(fp);
}

第二种方法就是:(不使用feof,换种方法。)

1、把文件内部指针移动到文件尾部。
fseek(fp,0,2);
2、用一个整形变量记录这个文件尾部的位置
wjcd = ftell(fp);
 
3、把文件内部指针移到到文件头部;
fseek(fp,0,0);
 
4、这样就可以了
while(wjcd == ftell(fp))

注: 
1)  欲将读写位置移动到文件开头时:fseek(FILE  *stream,0,SEEK_SET);

2)   欲将读写位置移动到文件尾时:fseek(FILE  *stream,0,SEEK_END);

参数SEEK_SET是从距文件开头offset位移量为新的读写位置;SEEK_CUR是以目前的读写位置往后增加offset个位移量;SEEK_END将读写位置指向文件尾后再增加offset个位移量。当whence值为SEEK_CUR或SEEK_END时,参数offset允许负值的出现。

#include <stdio.h>
#include <stdlib.h> void process(char *filename, int n); int main(void)
{
char *filename = "file.c";
int n = ;
process(filename, n);
return ;
} void process(char *filename, int n)
{
FILE *fp1, *fp2;
char ch, pre;
int flag = ;
int i, j;
if((fp1 = fopen(filename, "rb")) == NULL)
{
printf("Cannot open this file1.\n");
exit();
}
if((fp2 = fopen("temp.c", "wb")) == NULL)
{
printf("Cannot open this file2.\n");
exit();
} pre = '\0';
ch = fgetc(fp1);
while(!feof(fp1))
{
if(ch == '/' && pre == '/')
{
while(!feof(fp1))
{
pre = ch;
ch = fgetc(fp1);
if(ch == '\n')
{
ch = fgetc(fp1);
pre = '\n';
break;
}
}
} if(ch == '*' && pre == '/')
{
while(!feof(fp1))
{
pre = ch;
ch = fgetc(fp1);
if(ch == '/' && pre == '*')
{
ch = fgetc(fp1);
pre = '\0';
break;
}
}
} if(ch == '"')
{
while(!feof(fp1))
{
fputc(pre, fp2);
putchar(pre);
pre = ch;
ch = fgetc(fp1);
if(ch == '"')
break;
}
}
if(ch == ' ' && pre == ' ')
{
while(!feof(fp1))
{
ch = fgetc(fp1);
if(ch != ' ')
{
break;
} }
} fputc(pre, fp2);
putchar(pre);
pre = ch;
ch = fgetc(fp1);
} // remove(filename);
// rename("temp.c", filename);
fclose(fp1);
fclose(fp2);
}