C#与JS实现 获取指定字节长度 中英文混合字符串 的方法

时间:2022-11-03 04:53:00

平时在作数据库插入操作时,如果用 INSERT 语句向一个varchar型字段插入内容时,有时会因为插入的内容长度超出规定的长度而报错。

尤其是插入中英文混合字符串时,SQL Server中一般中文要占两个字节,所以对混合型的字符串就要作一个处理,统一按字节长度来计算字符串长度,方法如下:

C#方法一:

public static string GetString(string str, int len)
{
string result = string.Empty;// 最终返回的结果
int byteLen = System.Text.Encoding.Default.GetByteCount(str);// 单字节字符长度
int charLen = str.Length;// 把字符平等对待时的字符串长度
int byteCount = ;// 记录读取进度
int pos = ;// 记录截取位置
if (byteLen > len)
{
for (int i = ; i < charLen; i++)
{
if (Convert.ToInt32(str.ToCharArray()[i]) > )// 按中文字符计算加2
byteCount += ;
else// 按英文字符计算加1
byteCount += ;
if (byteCount > len)// 超出时只记下上一个有效位置
{
pos = i;
break;
}
else if (byteCount == len)// 记下当前位置
{
pos = i + ;
break;
}
} if (pos >= )
result = str.Substring(, pos);
}
else
result = str; return result;
}

C#方法二:推荐

/// <summary>
/// 字符串截取函数
/// </summary>
/// <param name="inputStr">需要截取的字符串</param>
/// <param name="length">要截取的长度</param>
/// <returns></returns>
public static string SubString(string inputStr,int length)
{
if (string.IsNullOrEmpty(inputStr))
{
return "";
}
string temp = inputStr;
int j = , k = ; CharEnumerator ce = inputStr.GetEnumerator();
while (ce.MoveNext())
{
j += (ce.Current > && ce.Current < ) ? : ; if (j <= length)
{
k++;
}
else
{
temp = inputStr.Substring(, k);
break;
}
}
return temp;
}

JS方法一(推荐):

 function SubString(str, len, hasDot) {
///<summary>
////显示窗口
///</summary>
/// <param name="selector" type="String">
/// 1: str - 源字符串 /// 2: len - 要截取的长度。
/// 3: hasDot - 是否显示…。
/// </param>
var newLength = ;
var newStr = "";
var chineseRegex = /[^\x00-\xff]/g;
var singleChar = "";
var strLength = str.replace(chineseRegex, "**").length;
for (var i = ; i < strLength; i++) {
singleChar = str.charAt(i).toString();
if (singleChar.match(chineseRegex) != null) {
newLength += ;
}
else {
newLength++;
}
if (newLength > len) {
break;
}
newStr += singleChar;
} if (hasDot && strLength > len) {
newStr += "...";
}
return newStr;
}

JS方法二(由C#方法一改写成JS):

//****************************************************************
//* 名  称:获取指定字节长度的中英文混合字符串//* 功 能:平时在作数据库插入操作时,如果用 INSERT 语句向一个varchar型字段插入内容时,有时会因为插入的内容长度超出规定的长度而报错。
// 尤其是插入中英文混合字符串时,SQL Server中一般中文要占两个字节,所以对混合型的字符串就要作一个处理,统一按字节长度来计算字符串长度
// JS中的几个函数:
// charAt(num) //获取字符串的num位置的字符
// 字符转ascii码:用charCodeAt();
// ascii码转字符:用fromCharCode();
// 示例:
//<script>
//str="A";
//code = str.charCodeAt();
//str2 = String.fromCharCode(code);
//str3 = String.fromCharCode(0x60+26);
//document.write(code+'<br />');
//document.write(str2+'<br />');
//document.write(str3);
//</script>
//输出:
//65
//A
//z
//* 入口参数:str:需要计算的数据
//* 出口参数:返回str指定长度len的字符串(双字节(包含中文)长度为2,单字节长度为1)
//*****************************************************************
function JsSubString(str, len) {
var result = ""; // 最终返回的结果
var chineseRegex = /[^\x00-\xff]/g;
var byteLen = str.replace(chineseRegex, "**").length; // 单字节字符长度
var charLen = str.length; // 把字符平等对待时的字符串长度
var byteCount = ;// 记录读取进度
var pos = ;// 记录截取位置
if (byteLen > len)
{
for (var i = ; i < charLen; i++) {
if (str.split("")[i].charCodeAt() > )// 按中文字符计算加2
byteCount += ;
else// 按英文字符计算加1
byteCount += ;
if (byteCount > len)// 超出时只记下上一个有效位置
{
pos = i;
break;
}
else if (byteCount == len)// 记下当前位置
{
pos = i + ;
break;
}
} if (pos >= )
result = str.substring(, pos);
}
else
result = str; return result;
}