Linux 回车与换行格式转换编码转换

在windows下写得shell脚本，在Linux下执行，总是报错。Google后得到解决方案，同时看到乱码解决方案，转帖至此。

最近在看以前在Windows下VC写的代码，发现每行代码后都有一个“^M”符号，而且代码中的中文注释也都是乱码的了。google了一下，总算把这两个事弄明白了。

关于回车与换行

很久以前，老式的电传打字机使用两个字符来另起新行。一个字符把滑动架移回首位 (称为回车，<CR>，ASCII码为0D)，另一个字符把纸上移一行 (称为换行, <LF>，ASCII码为0A)。当计算机问世以后，存储器曾经非常昂贵。有些人就认定没必要用两个字符来表示行尾。UNIX 开发者决定他们可以用一个字符来表示行尾，Linux沿袭Unix，也是<LF>。Apple 开发者规定了用<CR>。开发 MS-DOS以及Windows 的那些家伙则决定沿用老式的<CR><LF>。

因为MS-DOS及Windows是回车＋换行来表示换行，因此在Linux下用Vim查看在Windows下用VC写的代码（vim -b），行尾后的“^M”符号，表示的是符。可以用:set ff? 来查看是否文件的格式，可以看到dos或unix的字样。

1. 在Vim中解决这个问题，很简单，在Vim中利用替换功能就可以将“^M”都干掉，键入如下替换命令行：

:%s/^M//g

注意：上述命令行中的“^M”符，不是“^”再加上“M”，而是由“Ctrl+v”、“Ctrl+M”键生成的

2. 用命令 :set fileformat=unix

:w 　　这样文件就转换成unix格式文件了

或者也可以用set ff=unix 把它强制为unix格式，

也可以用sed 这样的工具来做:　sed ‘s/^M//’ filename > tmp_filename 　　其中^M是同时Ctrl+V+M按出来的，表示回车。

关于gb2312编码文本转换为utf8格式

iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。

用法： iconv [选项...] [文件...]

有如下选项可用:

输入/输出格式规范：
-f, --from-code=名称原始文本编码
-t, --to-code=名称输出编码
信息：
-l, --list 列举所有已知的字符集
输出控制：
-c 从输出中忽略无效的字符
-o, --output=FILE 输出文件
-s, --silent 关闭警告
--verbose 打印进度信息
-?, --help 给出该系统求助列表
--usage 给出简要的用法信息
-V, --version 打印程序版本号

示例:

iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt

这个命令读取aaa.txt文件，从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。

秒客网

Linux 回车与换行格式转换编码转换

关于回车与换行

关于gb2312编码文本转换为utf8格式

相关文章

Linux 回车与换行 格式转换 编码转换

关于回车与换行

关于gb2312编码文本转换为utf8格式

相关文章

Linux 回车与换行格式转换编码转换