System.Text.Encoding 类似乎没有可用的构造函数,但我们可以找到几个默认的 Encoding,即 Encoding.Default(获取系统的当前 ANSI 代码页的编码)、Encoding.ASCII(获取 7 位 ASCII 字符集的编码)、Encoding.Unicode(获取采用 Little-Endian 字节顺序的 Unicode 格式的编码)、Encoding.UTF7(获取 UTF-7 格式的编码)、Encoding.UTF8(获取 UTF-8 格式的编码) 等。这里主要说说 Encoding.Default 和 Encoding.Unicode 用于转换的区别。
在字符串转换到字节数组的过程中,Encoding.Default 会将每个单字节字符,如半角英文,而把每个双字节字符,如汉字。而 Encoding.Unicode 则会将它们都转换成两个字节。我们可以通过下列简单的了解一下转换的方法,以及使用 Encoding.Default 和 Encodeing.Unicode 的区别:
private void TestStringBytes() { string s = "C#语言"; byte[] b1 = System.Text.Encoding.Default.GetBytes(s); byte[] b2 = System.Text.Encoding.Unicode.GetBytes(s); string t1 = "", t2 = ""; foreach (byte b in b1) { t1 += b.ToString("") + " "; } foreach (byte b in b2) { t2 += b.ToString("") + " "; } this.textBox1.Text = ""; this.textBox1.AppendText("b1.Length = " + b1.Length + "\n"); this.textBox1.AppendText(t1 + "\n"); this.textBox1.AppendText("b2.Length = " + b2.Length + "\n"); this.textBox1.AppendText(t2 + "\n"); }
运行结果如下,不说详述,相信大家已经明白了。
- b1.Length = 6
- 67 35 211 239 209 212
- b2.Length = 8
- 67 0 35 0 237 139 0 138
将C#字节数组转换成字符串,使用 Encoding 类的 string GetString(byte[]) 或 string GetString(byte[], int, int) 方法,具体使用何种 Encoding 还是由编码决定。在 TestStringBytes() 函数中添加如下语句作为实例:
- byte[] bs = {97, 98, 99, 100, 101, 102};
- string ss = System.Text.Encoding.ASCII.GetString(bs);
- this.textBox1.AppendText("The string is: " + ss + "\n");
运行结果为:The string is: abcdef