在linux下打开文件出现^M,^H

时间:2021-01-03 16:47:07

0 Problem

在服务器上跑keras实验,然后用tee指令把实验结果保存在文本文件中。

 文本文件在本机linux下用vim打开文件时会出现^M,^H。用sublime打开也会出现奇怪的字符。

1 Reason

    linux下的换行符是\n,windows是\r\n,所以windows下的文件在linux下打开的话,\r会作为控制字符^M显示。(mac下换行符是\r)

^H出现的原因未知,估计是keras的进度条显示的方法造成。其实原因不太重要,反正能去掉,保证看的顺眼就好了。

 说到控制字符,可以简单列举几个。如下表所示,其中LF和CR是常用的换行符,SOH, EOT, ESC三个字符在计算机网络的数据链路层的帧传输时用到过,NUL为C中字符串结束提供标志\0。

Seq   ^J ^M ^H ^A ^D ^{  
十进制       10 13 08 01 04 27 00
缩写       LF CR BS SOH EOT ESC NUL
字符名       

Line Feed

(换行)

Carriage Return

(回车)

Backspace

(退格)

Starting of Heading

(报头开始)

End of transmission

(传输结束)

Escape

(转义)

Null

(空)

2 Solution

在vim下把^M替换掉。注意^M的输入方式为:ctrl + v 和ctrl + m

:%s/^M$//g

所以文件里又一些奇怪的字符,也可以这样去掉,比如^H。注意^H的输入方式为:ctrl + v 和ctrl + h

 :%s/^H//g

3 Others

网上看到一些别的方法,take notes下。

:set ff=unix # 告诉vim使用unix换行符

find ./ -type f -print0 | xargs -0 dos2unix # 批量查找普通文件,然后执行dos2unix转换过格式