EOF的一点注记

时间:2022-06-30 15:44:09
int ch;
while( (ch = getchar()) != EOF )
{
putchar(ch);
}

执行程序,输入:we are the,然后回车。运行结果如下:

[purple@localhost 0822]$ ./a.out
we are the
we are the

注意光标位置是在最后一行空白行上,以及getchar是接收空格以及\n的。

即执行程序,输入:we are the,然后回车。则程序就会去执行puchar(ch),然后输出we are the,这个地方不要忘了,系统输出的还有一个回车。然后可以继续输入,再次遇到换行符的时候,程序又会把那一行的输入的字符输出在终端上。

以下一段文字解释的很是到位,我在此处作了引用:

对于getchar,肯定很多初学的朋友会问,getchar不是以字符为单位读取的吗?那么,既然我输入了第一个字符a,肯定满足while循环(c = getchar()) != EOF的条件阿,那么应该执行putchar(c)在终端输出一个字符a。不错,我在用getchar的时候也是一直这么想的,但是程序就偏偏不着样执行,而是必需读到一个换行符或者文件结束符EOF才进行一次输出。

对这个问题的一个解释是,在大师编写C的时候,当时并没有所谓终端输入的概念,所有的输入实际上都是按照文件进行读取的,文件中一般都是以行为单位的。因此,只有遇到换行符,那么程序会认为输入结束,然后采取执行程序的其他部分。同时,输入是按照文件的方式存取的,那么要结束一个文件的输入就需用到EOF (Enf Of File). 这也就是为什么getchar结束输入退出时要用EOF的原因。

getchar()的返回值一般情况下是字符,但也可能是负值,即返回EOF。
这里要强调的一点就是,getchar函数通常返回终端所输入的字符,这些字符系统中对应的ASCII值都是非负的。因此,很多时候,我们会写这样的两行代码:

char c;
c = getchar();

这样就很有可能出现问题。因为getchar函数除了返回终端输入的字符外,在遇到Ctrl+D(Linux下)即文件结束符EOF时,getchar ()的返回EOF,这个EOF在函数库里一般定义为-1。因此,在这种情况下,getchar函数返回一个负值,把一个负值赋给一个char型的变量是不正确的。为了能够让所定义的变量能够包含getchar函数返回的所有可能的值,正确的定义方法如下(K&R C中特别提到了这个问题):

int c;
c = getchar();

既然提到了getchar的返回值,那么我在此处就getchar返回值用int的原因做下详细的阐述:

之所以返回值使用int是因为:标准ASCII码范围为0-127,用带符号char类型来存储。其余的ASCII字符在不同的国家其取值并不一样,而带符号char类型的取值范围为-128至127,并不能涵盖各个国家的标准。例如一个数值为0x3ff的ascii码存在char中为0xff,代表-1,这显然不正确。因此此处用int类型,这样可以完整表示ascii码范围。

小结1

getchar是以行为单位进行存取的。当用getchar进行输入时,如果输入的第一个字符为有效字符(即输入不是文件结束符EOF,Windows下为组合键Ctrl+Z, Unix/Linux下为组合键Ctrl+D),那么只有当最后一个输入字符为换行符'\n'(也可以是文件结束符EOF,EOF将在后面讨论)时, getchar才会停止执行,整个程序将会往下执行。

EOF(主要指普通终端中的EOF)

1.EOF作为文件结束符时的情况:EOF虽然是文件结束符,但并不是在任何情况下输入Ctrl+D(Windows下Ctrl+Z)都能够实现文件结束的功能,只有在下列的条件下,才作为文件结束符。

(1)遇到getcahr函数执行时,要输入第一个字符时就直接输入Ctrl+D,就可以跳出getchar(),去执行程序的其他部分;

(2)在前面输入的字符为换行符时,接着输入Ctrl+D;

(3)在前面有字符输入且不为换行符时,要连着输入两次Ctrl+D,这时第二次输入的Ctrl+D起到文件结束符的功能,至于第一次的Ctrl+D的作用将在下面介绍。

其实,这三种情况都可以总结为只有在getchar()提示新的一次输入时,直接输入Ctrl+D才相当于文件结束符。

2.EOF作为行结束符时的情况,这时候输入Ctrl+D并不能结束getchar(),而只能引发getchar()提示下一轮的输入。

这种情况主要是在进行getchar()新的一行输入时,当输入了若干字符(不能包含换行符)之后,直接输入Ctrl+D,此时的Ctrl+D并不是文件结束符,而只是相当于换行符的功能,即结束当前的输入。

以上面的代码段为例,如果执行时输入abc,然后Ctrl+D,程序输出结果为:abcabc。

注意:第一组abc为从终端输入的,然后输入Ctrl+D,就输出第二组abc,同时光标停在第二组字符的c后面,然后可以进行新一次的输入。这时如果再次输入Ctrl+D,则起到了文件结束符的作用,结束getchar()。

小结2

EOF的作用也可以总结为:当终端有字符输入时,Ctrl+D产生的EOF相当于结束本行的输入,将引起getchar()新一轮的输入;当终端没有字符输入或者可以说当getchar()读取新的一次输入时,输入Ctrl+D,此时产生的EOF相当于文件结束符,程序将结束getchar()的执行。、

总之就是:只有在getchar()提示新的一次输入时,直接输入Ctrl+D才相当于文件结束符。

关于scanf的例子

代码如下:

int main(int argc, char *argv[])
{
char word[256];
while(memset(word,0,256),scanf("%s",word) != EOF)
{
printf("%s ",word);
}
return 0;
}

1

当程序运行后,输入how are you空格,即:

EOF的一点注记

此时按下第一次Ctrl+D,得到:

EOF的一点注记

此时再按Ctrl+D,退出程序:

EOF的一点注记

2

当程序运行后,输入how are you,不带空格,即:

EOF的一点注记

按下第一次Ctrl+D,得到:

EOF的一点注记

按下第二次Ctrl+D,得到:

EOF的一点注记

按下第三次Ctrl+D,退出程序:

EOF的一点注记