参考文献:搞懂ASCII, ISO8859-1, ANSI和Unicode
注:
1、utf-8虽然是国际编码,对不同范围的字符使用不同长度的编码,也完全兼容了ASCII编码编码,但却没有兼容ISO-8859-1在ASCII编码扩展的字符(utf-8中用其他编码号代替),由于最高位被utf-8编码标识单字节字符占用。
2、String(bytes,charsetName)获取指定字符集编码字符串时,假如指定字符集不支持(无法完全匹配到字符)时,程序直接默认ISO-8859-1字符集转换返回。
3、String(bytes)或String.getBytes()在不指定字符编码时都会使用默认字符集编码方式,如果默认字符集不支持(无法完全匹配到字符)时,程序直接默认ISO-8859-1字符集转换返回。