Java读写txt文件中文乱码问题

时间:2023-01-11 16:06:42

问题:在用Java程序进行读写含中文的txt文件时,经常会出现读出或写入的内容会出现乱码。原因其实很简单,就是系统的编码和程序的编码采用了不同的编码格式。通常,假如自己不修改的话,windows自身采用的编码格式是gbk(而gbk和gb2312基本上是一样的编码方式),而IDE中Encode不修改的话,默认是utf-8的编码,这就是为什么会出现乱码的原因。当在OS下手工创建并写入的txt文件(gbk),用程序直接去读(utf-8),就会乱码。为了避免可能的中文乱码问题,最好在文件写入和读出的时候显式指定编码格式。

1、写文件:

[java] view plain copy
  1. public static void writeFile(String fileName, String fileContent)   
  2. {     
  3.     try   
  4.     {      
  5.         File f = new File(fileName);      
  6.         if (!f.exists())   
  7.         {       
  8.             f.createNewFile();      
  9.         }      
  10.         OutputStreamWriter write = new OutputStreamWriter(new FileOutputStream(f),"gbk");      
  11.         BufferedWriter writer=new BufferedWriter(write);          
  12.         writer.write(fileContent);      
  13.         writer.close();     
  14.     } catch (Exception e)   
  15.     {      
  16.         e.printStackTrace();     
  17.     }  
  18. }  

2、读文件:

[java] view plain copy
  1. public static String readFile(String fileName)  
  2. {     
  3.     String fileContent = "";     
  4.     try   
  5.     {       
  6.         File f = new File(fileName);      
  7.         if(f.isFile()&&f.exists())  
  8.         {       
  9.             InputStreamReader read = new InputStreamReader(new FileInputStream(f),"gbk");       
  10.             BufferedReader reader=new BufferedReader(read);       
  11.             String line;       
  12.             while ((line = reader.readLine()) != null)   
  13.             {        
  14.                 fileContent += line;       
  15.             }         
  16.             read.close();      
  17.         }     
  18.     } catch (Exception e)   
  19.     {         
  20.         e.printStackTrace();     
  21.     }     
  22.     return fileContent;   
  23. }   
    1. //默认情况下,win系统编码是gbk/gbk2312,读取和写入时加入编码字符集可以解决乱码   记事本默认是ansi编码,也就是gbk,怪不得把编码方式改成utf-8没用