Linux内核分析——字符集总结与分析

时间:2024-05-21 20:46:30

 

一、  设置修改系统、应用默认字符集

1. 查看虚拟机的字符集:

 Linux内核分析——字符集总结与分析

由此可见,该虚拟机的字符集为zh_CN.UTF-8。

2. 查看服务器支持的编码方式

 Linux内核分析——字符集总结与分析

3. 修改字符集类型

 Linux内核分析——字符集总结与分析

    上图可见,LANG字符集类型修改为en_US.utf-8。

4. 查看某个文件的字符类型

 Linux内核分析——字符集总结与分析

二、  同一文件存储为不同字符集,并分析原始数据

 

三、总结:

分析完这4个文件,我们发现这4种编码方式只是汉字不同格式运用不同编码,而阿拉伯数字和英文字母都是用ascii编码表示,也就是为什么我们有时候打开一个文件会出现乱码,而阿拉伯数字和英文字母都是正常的原因,汉字在不同的编码格式中都是有不同的汉字编码,而阿拉伯数字和英文字母通用ascii编码表示。