今天下午用Java读取从淘宝助理 V4.3 Beta1导出的csv文件,出现中文乱码情况。
一看就是文件编码引起的,不清楚淘宝助理导出的csv文件使用了什么编码,到百度搜索了一下,看到一些相关文章,但测试发现都没有解决这个问题。
最后,我抱着试试看的态度,使用了 utf-16 ,我晕,正常显示中文了。
关于 utf-16 这种编码,这么多看来我还是第一次使用,之前最常用的是 gb2312 和 utf-8 之间的转换。
下面是一个简单的例子:
try
{
DataInputStream in = new DataInputStream(new FileInputStream(new File("sd.csv")));
BufferedReader br = new BufferedReader(new InputStreamReader(in,"utf-16"));
while(br.ready())
{
System.out.println(br.readLine());
} br.close(); }
catch(IOException err)
{
err.printStackTrace();
}
2010-05-11