以下代码测试通过。问题是里面的中文,在反序列化后是乱码。
1. 序列化对象为字符串,Subject 里面的中文看起来正常,仍然是中文;
2. 反序列化为对象后,Subject 里面的中文是乱码。
XE2 处理 Unicode 还是有问题啊。
TItemRecord = class
private
FID: string;
FSubject: string;
FADate: TDateTime;
published
property ID: string read FID write FID;
property Subject: string read FSubject write FSubject;
property ADate: TDateTime read FADate write FADate;
end;
procedure TForm1.Button3Click(Sender: TObject);
var
JO: TJSONObject;
P:TJSONPair;
A:TJSONArray;
B:TBytes;
S:string;
JM:TJSONMarshal;
JUM:TJSONUnMarshal;
Item: TItemRecord;
V, V2:TJSONValue;
UJ: TJSONUnMarshal;
begin
//采用 JSON
JM:=TJSONMarshal.Create;
Item := TItemRecord.Create;
with ClientDataSet1 do
begin
Item.ID := FieldByName(‘ID‘).AsString;
Item.Subject := FieldByName(‘Subject‘).AsString;
Item.ADate := FieldByName(‘ADate‘).AsDateTime;
end;
V:=JM.Marshal(Item); //序列化
S := V.ToString;
Item.Free;
V.Free;
Memo1.Lines.Text := S;
//------------------- 反序列化-------------
JO := TJSONObject.Create;
JO.Parse(BytesOf(S), 0, Length(S)); //将字符串变回 Json 对象
UJ := TJSONUnMarshal.Create;
Item := UJ.Unmarshal(JO) as TItemRecord; //将 Json 对象变回我自己的对象。
Memo1.Lines.Add(‘-----------‘);
Memo1.Lines.Add(‘ID = ‘ + Item.ID);
Memo1.Lines.Add(‘Subject = ‘ + Item.Subject); //问题: 对字符串里面的汉字编码没搞好,有问题。
Memo1.Lines.Add(‘Date = ‘ + DateTimeToStr(Item.ADate));
end;
---------------------------------------------------- 分隔符 -------------------------
前面说到,把对象用 ToString 的方法输出为字符串时,对象里面的中文在字符串里面是正确的,把字符串写道 TMEMO 里面显示出来的中文正常。但如果这时候把这个字符串用 JO.Parse(BytesOf(S), 0, Length(S)); 语句变回对象,则对象的中文字段值是乱码。
采用:B := TEncoding.ASCII.GetBytes(S); 的方式获得的 TBytes 用于 Parse,出来的对象,中文值也是乱码;
如果采用 B := TEncoding.Unicode.GetBytes(S); 的方式获得的 TBytes 用于Parse无法获得正确的对象,即运行 Jo.Parse(B, 0); 时会出现异常。
测试,不输出字符串,而是直接输出 TBytes,然后再拿这个 TBytes 去 Parse,获得的对象,中文字段值OK,没有乱码。
SetLength(B, 200);
i := V.ToBytes(B, 0);
JO := TJSONObject.Create;
Jo.Parse(B, 0);
UJ := TJSONUnMarshal.Create;
Item := UJ.Unmarshal(JO) as TItemRecord;
这样获得的 Item 对象,其中文字段值没乱码。
也就是说,它的 ToString 输出的不知道是什么编码,需要按其编码变换回 TBytes 才行。简单的 BytesOf(S) 不行。
----------------------------
继续测试:采用 UTF8 字符串
S := V.ToString;
S8 := Utf8Encode(S); //S8: UTF8STRING;
V2 := TJSONObject.ParseJSONValue(S8); //V2: TJSONValue;
然后, Item := UJ.Unmarshal(V2) as TItemRecord; 可以成功获得有中文字段值的对象!
也就是说,DELPHI 自带的 JSON 库,不能正确处理 UNICODE 双字节字符串,但能处理 UTF8 字符串。
-------------------------
继续:要处理中文,上面采用 Jo.Parse(B, 0); 的方式,直接处理中文字符串,,获得的对象的中文字段值会乱码。
这样处理就对了:
V: TJSONValue;
V := TJSONObject.ParseJSONValue(S);
UJ := TJSONUnMarshal.Create;
Item := UJ.Unmarshal(V) as TItemRecord;
这样获得的对象,字段的中文值不是乱码,正常了。
总 结:不要用 TJSONObject 的对象的 Parse 方法来解析字符串为 JSON 对象,而应该用类方 法 TJSONObject.ParseJSONValue(S) 的方式来获得 TJSONValue 对象,然后拿这个 JSONValue 对象去 反序列化出来的对象,中文没问题。
---------------------------------
总结:绕了一大圈,其实很简单!它是可以直接处理UNICODE字符串的。只是 DELPHI 给出的这个JSON库里面的对象的方法,不太直观。