字节流与字符流的区别

时间:2021-02-04 21:01:04

最近在项目中遇到一个encoding的问题,记录一下。

    具体而言就是,项目中有A/B两个部分,A部分由我们负责,Java实现;B部分是UK负责的,使用Delphi,A、B在交互时发送一个http请求, 请求汇总包括一些文本信息(header),以及一个zip文件(body)。好了,问题出来了,当我们发送请求过去时,B能接收到请求,并读出 header,也能读出body部分的zip文件,但是读出的zip文件确实corrupted,死活不能打开。

     --------------------

     ---header(文本)-

     -----body(zip)---

     --------------------

   经过无数反复的折腾后(与UK的人同步,痛苦啊),发现我们的系统有问题,问题是在于,我们在构造请求文件的时候,是把zip文件作为一个字符流读取,并 添加到一个字符流中,然后把这个字符流发送出去。这个body部分,加入到body后,就成为字符流的一部分,结果也带有encoding信息,这样发送 到B部分后,就无法正确读取了。

      ------------------------

      ---header(String)---

A    -------------------------               ------>  httpClient)(String)  ------------->B

      -----body(String)----

      -------------------------

   正确的做法应该是,在读取header部分后,转化为字节流存入一个暂时的byte pool中,然后再把zip部分也作为一个字节流读出,放到上面的byte pool中。最后把这个byte pool 发送 出去。

 

     ------------------------

     ---header(string)---

  A -------------------------               ------>  httpClient)(byte[])  ------------->B

     -----body(byte[])----

     -------------------------

 

  从这个例子可以更加深刻的认识下面的道理:

  概念:

    字符流处理的单元为2个字节的Unicode字符,分别操作字符、字符数组或字符串,而字节流处理单元为1个字节, 操作字节和字节数组。所以字符流是由Java虚拟机将字节转化为2个字节的Unicode字符为单位的字符而成的,所以它对多国语言支持性比较好!如果是 音频文件、图片、歌曲,就用字节流好点,如果是关系到中文(文本)的,用字符流好点.
     所有文件的储存是都是字节(byte)的储存,在磁盘上保留的并不是文件的字符而是先把字符编码成字节,再储存这些字节到磁盘。在读取文件(特别是文本文件)时,也是一个字节一个字节地读取以形成字节序列.
      字节流可用于任何类型的对象,包括二进制对象,而字符流只能处理字符或者字符串; 2. 字节流提供了处理任何类型的IO操作的功能,但它不能直接处理Unicode字符,而字符流就可以。

  转换:

在从字节流转化为字符流时,实际上就是byte[]转化为String时,
public String(byte bytes[], String charsetName)
有一个关键的参数字符集编码,通常我们都省略了,那系统就用操作系统的lang
而在字符流转化为字节流时,实际上是String转化为byte[]时,
byte[]    String.getBytes(String charsetName)
也是一样的道理

  Java操作篇:

  IO分两种流

字节流 InputStream OutputStream

字符流 Reader Writer

他们都是抽象类

具体实现
字节流 FileInputStream FileOutputStream
字符流 FileReader FileWriter 

  字节流转换成字符流可以用 InputSteamReader OutputStreamWriter

转换成BufferdReader BufferedWriter 他们具有缓冲区

例如:读取文件 从字节流输入到字符流输入
定义一个字节流:
FileInputStream fileInputStream = new FileInputStream("d:/text.txt");

// 定义一个指向D:/TEXT.TXT 的字节流

InputStreamReader inputStreamReader = new InputStreamReader(fileInputStream);
//字节流转换成InputStreamReader
BufferedReader bufferedReader = new BufferedReader(inputSteamReader);
//InputStreamReader 转换成带缓存的bufferedReader

可以把读出来的内容赋值给字符

String ss = new String();
String s;
while((s = bufferedReader.readLine())!=null){
ss += s;
}

例如:写入文件 从字节流输出到字符流输出

FileOutputStream fileOutputStream = new FileOutputStream("d:/text.txt"); //定义一个

指向D:/TEXT.TXT文件

OutputStreamWriter outputStreamWriter = new OutputStreamWriter(fileOutputStream);

BufferedWriter bufferedWriter = new BufferedWriter(outputStreamWriter);

bufferedWriter.write(s);

bufferedWriter.close();
outputStreamWriter.close();
fileOutputStream.close();


例程:
     将字符串转化为字节流#region 将字符串转化为字节流
        /**//// <summary>
        /// 将字符串转化为字节流
        /// </summary>
        /// <param name="_Source">字串</param>
        /// <returns>字节流</returns>
        public static byte[] String2Bytes(string strSource)
        {
            System.IO.MemoryStream   memoryStream=new   System.IO.MemoryStream();  
            System.IO.BinaryWriter   binaryWriter=new   System.IO.BinaryWriter(memoryStream);  
            binaryWriter.Write( strSource );
            byte[]   buffer=memoryStream.GetBuffer();
            return buffer;   
        }
        #endregion

       
        将字节流转化为字符串#region 将字节流转化为字符串
        /**//// <summary>
        /// 将字节流转化为字符串
        /// </summary>
        /// <param name="bytData">字节流</param>
        /// <returns>字串</returns>
        public static string Bytes2String(byte[] bytData)
        {
            //字节流->字符串  
            System.IO.MemoryStream   memoryStream2 = new   System.IO.MemoryStream(bytData);  
            System.IO.BinaryReader   binaryReader = new   System.IO.BinaryReader(memoryStream2);  
            string   s2=binaryReader.ReadString();  
            return s2;
        }
        #endregion