哈夫曼编码--贪心算法

时间:2022-03-22 11:09:34
        哈夫曼编码(Huffman Coding)是一种编码方式,是一种用于无损数据压缩的熵编码(权编码)算法。1952年,David A. Huffman在麻省理工攻读博士时所发明的,并发表于《一种构建极小多余编码的方法》(A Method for the Construction of Minimum-Redundancy Codes)一文。 

       在计算机数据处理中,哈夫曼编码使用变长编码表对源符号(如文件中的一个字母) 进行编码,其中变长编码表是通过一种评估来源符号出现机率的方法得到的,出现机率高的字母使用较短的编码,反之出现机率低的则使用较长的编码,这便使编码 之后的字符串的平均长度、期望值降低,从而达到无损压缩数据的目的。

C++实现:

#include<iostream>
#include<string>
#include<queue>
using namespace std;

class node
{
public:
node(string con, float wht, node* left, node* right, string co )
{
content=con;
weight=wht;
leftchild=left;
rightchild=right;
code=co;
}
string content;
float weight;
node* leftchild;
node* rightchild;
string code;
};

void insertion_sort(node** array, int low, int high)
//直接插入排序
{
for(int i=low+1;i<high;i++)
{
node* tem=array[i];
int j=i-1;
while(array[j]->weight>tem->weight&&j>=low)
{
array[j+1]=array[j];
j--;
}
array[j+1]=tem;
}
}

void create_huffman_tree(string* s, float* w,int n,node** array)
{
for(int i=0;i<n;i++)
{
array[i]=new node(s[i],w[i],NULL,NULL,"");
}
insertion_sort(array,0,n);
int p=0;
while(p!=n-1)
{
node* min_1=array[p];
node* min_2=array[p+1];
node* new_node=new node("",min_1->weight+min_2->weight,min_1,min_2,"");
array[p+1]=new_node;
p=p+1;
insertion_sort(array,0,n);
}

}

void create_huffman_code(node* p)
{
queue<node*> nq;
nq.push(p);//进队列
while(nq.size()!=0)
{
node* cur=nq.front();
nq.pop();//出队列
node* l=cur->leftchild;
if(l!=NULL)
{
l->code=cur->code+"0";
nq.push(l);
}
node* r=cur->rightchild;
if(r!=NULL)
{
r->code=cur->code+"1";
nq.push(r);
}
if(l==NULL&&r==NULL)
{
cout<<cur->content<<": "<<cur->code<<endl;
}
}
}

int main(int argc, char** argv)
{
node* array[8];
string s[8]={"a","b","c","d","e","f","g","h"};
float w[8]={1,1,2,3,5,8,13,21};
create_huffman_tree(s,w,8,array);
create_huffman_code(array[7]);
}
结果:

哈夫曼编码--贪心算法