霍夫曼编码

时间:2011-06-20 15:22:54
【文件属性】:

文件名称:霍夫曼编码

文件大小:183KB

文件格式:RAR

更新时间:2011-06-20 15:22:54

哈夫曼编码

哈夫曼编码(Huffman Coding)是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种。 Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长 度最短的码字,有时称之为最佳编码,一般就叫作Huffman编码。 以哈夫曼树─即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。 在计算机信息处理中,“哈夫曼编码”是一种一致性编码法(又称"熵编码法"),用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。这种方法是由David.A.Huffman发展起来的。 例如,在英文中,e的出现概率很高,而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用一个位(bit)来表示,而z则可能花去25个位(不是26)。用普通的表示方法时,每个英文字母均占用一个字节(byte),即8个位。二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。


【文件预览】:
hufferman
----hufferman.ncb(41KB)
----hufferman.opt(48KB)
----hufferman.cpp(4KB)
----in.txt(23B)
----hufferman.dsw(543B)
----hufferman.dsp(3KB)
----Debug()
--------vc60.pdb(52KB)
--------hufferman.ilk(233KB)
--------vc60.idb(41KB)
--------hufferman.pch(199KB)
--------hufferman.exe(176KB)
--------hufferman.pdb(449KB)
--------hufferman.obj(8KB)
----hufferman.plg(1KB)

网友评论

  • 很实用的算法,编译运行通过!谢谢分享!