Rust 中编码标准的面向 Gecko 的实现

时间:2024-07-18 11:58:57
【文件属性】:

文件名称:Rust 中编码标准的面向 Gecko 的实现

文件大小:1.34MB

文件格式:ZIP

更新时间:2024-07-18 11:58:57

rust unicode encoding web charset

编码_rsencoding_rs 以 Rust 编写并在 Gecko(从 Firefox 56 开始)中使用的编码标准(非 JavaScript 部分)的实现。此外,mem模块提供各种操作来处理内存中的文本(与来自或去往 IO 边界的数据相反)。由于内部实现细节的效率,mem模块是一个模块而不是单独的 crate。功能由于 Gecko 用例,除了支持从 UTF-8 解码和编码的常见 Rust 用例之外,encoding_rs 还支持从 UTF-16 解码和编码。此外,API 被设计为对 FFI 友好,以适应 Gecko 的 C++ 方面。具体来说, encoding_rs 执行以下操作:将编码标准定义的字符编码中的字节流解码为有效对齐的本机字节序 in-RAM UTF-16(单位为u16 /char16_t )。将潜在无效的对齐本机字节序 in-RAM UTF-16(单位为u16 /char16_t )编码为编码标准定义的字符编码中的字节序列,就好像单独的代理在之前已被替换字符替换一样执行编码。(Gecko 的 UTF-16 可能无效。)将编码标准定义的字符编码中的字节流解码为有效的


网友评论