java 汉字与UTF-8十六进制编码 间相互转换方法

时间:2023-01-05 20:11:12

最近项目中需要把中文转换为UTF-8编码,并且还能将转换后的UTF-8编码转换为原来的中文,比如 上海 转换为UTF-8编码为 E4B88AE6B5B7,

Google了不少时间,然后参考 JDK源码 实现了上述功能

代码如下:


/**
* UTF-8编码 转换为对应的 汉字
*
* URLEncoder.encode("上海", "UTF-8") ---> %E4%B8%8A%E6%B5%B7
* URLDecoder.decode("%E4%B8%8A%E6%B5%B7", "UTF-8") --> 上 海
*
* convertUTF8ToString("E4B88AE6B5B7")
* E4B88AE6B5B7 --> 上海
*
* @param s
* @return
*/
public static String convertUTF8ToString(String s) {
if (s == null || s.equals("")) {
return null;
}

try {
s = s.toUpperCase();

int total = s.length() / 2;
int pos = 0;

byte[] buffer = new byte[total];
for (int i = 0; i < total; i++) {

int start = i * 2;

buffer[i] = (byte) Integer.parseInt(
s.substring(start, start + 2), 16);
pos++;
}

return new String(buffer, 0, pos, "UTF-8");

} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return s;
}

/**
* 将文件名中的汉字转为UTF8编码的串,以便下载时能正确显示另存的文件名.
*
* @param s 原串
* @return
*/
public static String convertStringToUTF8(String s) {
if (s == null || s.equals("")) {
return null;
}
StringBuffer sb = new StringBuffer();
try {
char c;
for (int i = 0; i < s.length(); i++) {
c = s.charAt(i);
if (c >= 0 && c <= 255) {
sb.append(c);
} else {
byte[] b;

b = Character.toString(c).getBytes("utf-8");

for (int j = 0; j < b.length; j++) {
int k = b[j];
if (k < 0)
k += 256;
sb.append(Integer.toHexString(k).toUpperCase());
// sb.append("%" +Integer.toHexString(k).toUpperCase());
}
}
}
} catch (Exception e) {
e.printStackTrace();

}
return sb.toString();
}