Java将中文转换成unicode字符。

时间:2021-07-09 23:27:49

先贴出处吧http://ljhzzyx.blog.163.com/blog/static/38380312201037102843515/

在看Java国际化程序的实现。从最基础的建立不同国家的属性文件开始吧。

中文:你好!

英语:Hello!

法语:Bonjour!

在属性文件定义时必须按照“名称_国家代码”的形式命名(),即所以属性文件的名称必须一样,只有国家代码不一样。

怎么获取不同国家的ISO编码呢?

1.可以直接去搜索

2.如果觉得麻烦也可以直接在IE浏览器中查看各个国家的编码,因为IE浏览器可以适应各个国家的语言要求。具体步骤(IE9浏览器):"Internet选项",在打开对话框中选择“常规”选项卡,单击"语言"按钮,再单击"添加"按钮,就会出现各个国家的编码。

Java将中文转换成unicode字符。

下面说说中文装unicode的方法吧。

在jdk的bin目录下有个转换工具:native2ascii,运行native2ascii加要转换的内容则可转换成unicode码,

带参数运行:native2ascii -reverse,则可从unicode码转成原有字符。

写好属性文件message_zh_CN.properties。为求简便,将其放置在bin目录下

执行 native2ascii message_zh_CN.properties 123.txt

打开123.txt就可以看到转换好的文件。

 

 

再看看代码实现吧。

/**
* 中文到unicode编码的转换
*/
public class UnicodeTest {

public static void main(String[] args) {
String cn = "怀念外婆屋后的柚子树";
System.out.println(cnToUnicode(cn));
// 字符串 : \u5f00\u59cb\u4efb\u52a1 ,由于 \ 在java里是转义字符,要写出下面这种形式
String unicode = "\\u5f00\\u59cb\\u4efb\\u52a1";
System.out.println(unicodeToCn(unicode));
}

private static String unicodeToCn(String unicode) {
/** 以 \ u 分割,因为java注释也能识别unicode,因此中间加了一个空格*/
String[] strs = unicode.split("\\\\u");
String returnStr = "";
// 由于unicode字符串以 \ u 开头,因此分割出的第一个字符是""。
for (int i = 1; i < strs.length; i++) {
returnStr += (char) Integer.valueOf(strs[i], 16).intValue();
}
return returnStr;
}

private static String cnToUnicode(String cn) {
char[] chars = cn.toCharArray();
String returnStr = "";
for (int i = 0; i < chars.length; i++) {
returnStr += "\\u" + Integer.toString(chars[i], 16);
}
return returnStr;
}

}