在SQL里截取字段的字符串时如何避免截取半个汉字?

时间:2023-01-12 10:55:14
为避免显示过长,在SQL里截取字段的字符串,但有时会将一个汉字截成两部分,如何避免?

8 个解决方案

#1


count=0
for i=1 to len(str)
    if asc(mid(str,i,1))<0 then
       count=count+2
    else
       count=count+1
    end if
    if count>=100 then
       if count=101 then 
          j=i-1         '最后一个是汉字,且刚好一半,则去掉该字全部
       else
          j=i             '正常
       end if
       exit for
    end if
next

#2


汉字的前一个字节ascii值是有一个范围的,只要判断值是否落在这个范围内
就可以判断是否是一个汉字的前一个字节。具体内容你可以去
http://www.china-askpro.com/vbasic16.shtml上看看,有相关内容。上面讲的是vb里的,不过意思是一样。


#3


SQL里不会截半个吧?

#4


xam_csdn(天问) ,你所说的网页里哪个题目讲到此问题,眼都找晕了

#5


所说的问题在SQL里发生,也必须在SQL内解决

#6


不要意思,你参考以下这段把

演示程序中主要是用了 IsDBCSLeadByte 这个 API 来判断某字节是否在双字节字符集(例如汉字)的前导字节集中(GB 2312-80 汉字编码中的第一个字节范围 0xA1-0xFe)

 

( The IsDBCSLeadByte function determines whether a character is a lead byte ?that is, the first byte

  of a character in a double-byte character set (DBCS).  )

 

procedure TForm1.Button1Click(Sender: TObject);

var

  CutLengthOfLine{ 被处理字符串的总长度 }, i, j: integer;

  sLine{ 被处理的源字符串 }: string;

  sCuted{ 按固定长度分割出来的部分字符串 }: string;

  iCutLength{ 按固定长度分割出来的部分字符串的长度 }: integer;

  bIsDBCS{ 是否是汉字的前半字节 }: boolean;

begin

if edit1.text='' then begin

exit;

end;

  CutLengthOfLine:=strtoint(edit1.text);

  if CutLengthOfLine < 2 then begin

  showmessage('CutLengthOfLine 必须大于等于 2 !');

  Exit;

  end;

  Memo2.Lines.Clear;

  for i := 0 to Memo1.Lines.Count - 1 do

  begin

    sLine := Memo1.Lines[i];

    if Length(sLine) = 0 then

      Memo2.Lines.Add(#13+#10)

    else

    repeat //开始处理字符串

      iCutLength := CutLengthOfLine;

      sCuted := Copy(sLine, 1, iCutLength);//从头取出 iCutLength 长的字符串

      bIsDBCS := False;//先假设没有半个字符串

      for j := 1 to iCutLength do //从头到尾逐个检查,至于为什么?

//原作者是这样解释的

//1. 为什麽不直接抓最後一个字元判断? 因为中文字的 Trail-byte, 其内码也可能落在 Lead-byte

//   的内码区间内.

//2. 为什麽不直接抓最後两个字元来判断? 因为前一个字的 Trail-byte 加上後一个字的 Lead-byte,

//   可能又是一个中文字.

      begin

        if bIsDBCS then  //如果上一个字节是汉字的前半部分

          bIsDBCS := False //则此时本字节是汉字的后半部分,

          //所以将是否前半个汉字检测标志设为假

        else

          if Windows.IsDBCSLeadByte(byte(sCuted[j])) then

            bIsDBCS := True;//否则检查本字节,并根据结果设置标志

      end;  //end of for

//如果最后一个字节的上一个字节是汉字的前半部分,则结束时

//检测标志为假,

      if bIsDBCS then Dec(iCutLength);

//如果最后一个字节是汉字的前半部分, 则少截取一个字符,避免乱码

      Memo2.Lines.Add(Copy(sLine, 1, iCutLength));

      sLine := Copy(sLine, iCutLength + 1, Length(sLine) - iCutLength);

//拷贝出下一部分固定长度的字符串,循环处理

    until Length(sLine) <= 0;

  end;

memo2.setfocus;

memo2.selstart:=0;

memo2.SelLength:=0;

end;

字符串分割的演示程序 

#7


用national text

#8


多谢诸位,截半个汉字的情况出现在使用(sybase)iso-1字符集,如果换成服务器和客户端全换成中文字符集就不存在这个问题了。根据载得汉字ASCII码,无法判断是汉字的高字节还是低字节,高字节范围与低字节范围有交叉。

#1


count=0
for i=1 to len(str)
    if asc(mid(str,i,1))<0 then
       count=count+2
    else
       count=count+1
    end if
    if count>=100 then
       if count=101 then 
          j=i-1         '最后一个是汉字,且刚好一半,则去掉该字全部
       else
          j=i             '正常
       end if
       exit for
    end if
next

#2


汉字的前一个字节ascii值是有一个范围的,只要判断值是否落在这个范围内
就可以判断是否是一个汉字的前一个字节。具体内容你可以去
http://www.china-askpro.com/vbasic16.shtml上看看,有相关内容。上面讲的是vb里的,不过意思是一样。


#3


SQL里不会截半个吧?

#4


xam_csdn(天问) ,你所说的网页里哪个题目讲到此问题,眼都找晕了

#5


所说的问题在SQL里发生,也必须在SQL内解决

#6


不要意思,你参考以下这段把

演示程序中主要是用了 IsDBCSLeadByte 这个 API 来判断某字节是否在双字节字符集(例如汉字)的前导字节集中(GB 2312-80 汉字编码中的第一个字节范围 0xA1-0xFe)

 

( The IsDBCSLeadByte function determines whether a character is a lead byte ?that is, the first byte

  of a character in a double-byte character set (DBCS).  )

 

procedure TForm1.Button1Click(Sender: TObject);

var

  CutLengthOfLine{ 被处理字符串的总长度 }, i, j: integer;

  sLine{ 被处理的源字符串 }: string;

  sCuted{ 按固定长度分割出来的部分字符串 }: string;

  iCutLength{ 按固定长度分割出来的部分字符串的长度 }: integer;

  bIsDBCS{ 是否是汉字的前半字节 }: boolean;

begin

if edit1.text='' then begin

exit;

end;

  CutLengthOfLine:=strtoint(edit1.text);

  if CutLengthOfLine < 2 then begin

  showmessage('CutLengthOfLine 必须大于等于 2 !');

  Exit;

  end;

  Memo2.Lines.Clear;

  for i := 0 to Memo1.Lines.Count - 1 do

  begin

    sLine := Memo1.Lines[i];

    if Length(sLine) = 0 then

      Memo2.Lines.Add(#13+#10)

    else

    repeat //开始处理字符串

      iCutLength := CutLengthOfLine;

      sCuted := Copy(sLine, 1, iCutLength);//从头取出 iCutLength 长的字符串

      bIsDBCS := False;//先假设没有半个字符串

      for j := 1 to iCutLength do //从头到尾逐个检查,至于为什么?

//原作者是这样解释的

//1. 为什麽不直接抓最後一个字元判断? 因为中文字的 Trail-byte, 其内码也可能落在 Lead-byte

//   的内码区间内.

//2. 为什麽不直接抓最後两个字元来判断? 因为前一个字的 Trail-byte 加上後一个字的 Lead-byte,

//   可能又是一个中文字.

      begin

        if bIsDBCS then  //如果上一个字节是汉字的前半部分

          bIsDBCS := False //则此时本字节是汉字的后半部分,

          //所以将是否前半个汉字检测标志设为假

        else

          if Windows.IsDBCSLeadByte(byte(sCuted[j])) then

            bIsDBCS := True;//否则检查本字节,并根据结果设置标志

      end;  //end of for

//如果最后一个字节的上一个字节是汉字的前半部分,则结束时

//检测标志为假,

      if bIsDBCS then Dec(iCutLength);

//如果最后一个字节是汉字的前半部分, 则少截取一个字符,避免乱码

      Memo2.Lines.Add(Copy(sLine, 1, iCutLength));

      sLine := Copy(sLine, iCutLength + 1, Length(sLine) - iCutLength);

//拷贝出下一部分固定长度的字符串,循环处理

    until Length(sLine) <= 0;

  end;

memo2.setfocus;

memo2.selstart:=0;

memo2.SelLength:=0;

end;

字符串分割的演示程序 

#7


用national text

#8


多谢诸位,截半个汉字的情况出现在使用(sybase)iso-1字符集,如果换成服务器和客户端全换成中文字符集就不存在这个问题了。根据载得汉字ASCII码,无法判断是汉字的高字节还是低字节,高字节范围与低字节范围有交叉。