文件名称:compression:压缩研究
文件大小:1019.29MB
文件格式:ZIP
更新时间:2024-06-01 20:04:08
C++
编码方案 按顺序出现在最后的二进制字符串中 第一位: “ 1”表示简化文本(在除去逗号,大写字母以及多个空格和句点之后)以句点结尾; “ 0”表示它不会在一段时间内结束 一组短语; 每个短语的编码如下: 此短语中单词组的数量(在开头的0后面加1),每个单词组的编码方式如下: 所使用的编码类型的指示器; “ 0”表示全局字典编码,“ 1”表示本地字典编码或标准编码; 如果“ 1”之后的下两位是“ 10”,则它是标准编码(这两位是垃圾),否则是本地字典编码(这两位是实际编码的一部分) 此单词组的相应编码(请参见下文): 全局字典编码 显示的字符数(开头的0后面加1) 表示所显示字符的<位置差异,char>列表(位置差异是当前显示的char的索引与上一个字符的索引之间的差异); 两者都被编码为在初始0之后没有额外的1 单词末尾的位置差(开头的0后面没有多余的1) 后缀trie搜索