实现UTF8与汉字相互转换的JavaScript代码(收藏)

时间:2021-10-31 20:19:53

//将输入串中的汉字变为UniCode(UTF8),其它字符不变
function toUTF8(szInput){
 var wch,x,uch="",szRet="";

 for (x=0; x<szInput.length; x++){
  wch=szInput.charCodeAt(x);
  if (!(wch & 0xFF80)){
   szRet += szInput.charAt(x);
  }else if (!(wch & 0xF000)){
   uch = "%" + (wch>>6 | 0xC0).toString(16) +
      "%" + (wch & 0x3F | 0x80).toString(16);
   szRet += uch;
  }else{
   uch = "%" + (wch >> 12 | 0xE0).toString(16) +
      "%" + (((wch >> 6) & 0x3F) | 0x80).toString(16) +
      "%" + (wch & 0x3F | 0x80).toString(16);
   szRet += uch;
  }
 }
 return(szRet);
}
//将输入串中的UniCode(UTF8编码还原)
function revertUTF8(szInput){
 var x,wch,wch1,wch2,uch="",szRet="";
 for (x=0; x<szInput.length; x++){
  if (szInput.charAt(x)=="%") {
   wch =parseInt(szInput.charAt(++x) + szInput.charAt(++x),16);
   if (!wch) {
    break;
   }
   if (!(wch & 0x80)) {
    wch = wch;
   } else if (!(wch & 0x20)){
    x++;
    wch1 = parseInt(szInput.charAt(++x) + szInput.charAt(++x),16);
    wch  = (wch & 0x1F)<< 6;
    wch1 = wch1 & 0x3F;
     wch  = wch + wch1;
   }  else {
    x++;
    wch1 = parseInt(szInput.charAt(++x) + szInput.charAt(++x),16);
    x++;
    wch2 = parseInt(szInput.charAt(++x) + szInput.charAt(++x),16);
    wch  = (wch & 0x0F)<< 12;
    wch1 = (wch1 & 0x3F)<< 6;
    wch2 = (wch2 & 0x3F);
    wch  = wch + wch1 + wch2;
   }
   szRet += String.fromCharCode(wch);
  } else {
   szRet += szInput.charAt(x);
  }
 }
 return(szRet);
}