题目描述:
编写一个哈夫曼编码译码程序。针对一段文本,根据文本中字符出现频率构造哈夫曼树,给出每个字符的哈夫曼编码,并进行译码,计算编码前后文本大小。
为确保构建的哈夫曼树唯一,本题做如下限定:
- 选择根结点权值最小的两棵二叉树时,选取权值较小者作为左子树。
- 若多棵二叉树根结点权值相等,则先生成的作为左子树,后生成的作为右子树,具体来说:i) 对于单结点二叉树,优先选择根结点对应字母在文本中最先出现者,如文本为cba,三个字母均出现1次,但c在文本中最先出现,b第二出现,故则选择c作为左子树,b作为右子树。ii) 对于非单结点二叉树,先生成的二叉树作为左子树,后生成的二叉树作为右子树。iii. 若单结点和非单结点二叉树根结点权值相等,优先选择单结点二叉树。
- 生成哈夫曼编码时,哈夫曼树左分支标记为0,右分支标记为1。
输入格式:
输入为3行。第1行为一个字符串,包含不超过5000个字符,至少包含两个不同的字符,每个字符为a-z的小写字母。第2、3行为两个由0、1组成的字符串,表示待译码的哈夫曼编码。
输出格式:
输出第一行为用空格间隔的2个整数,分别为压缩前后文本大小,以字节为单位,一个字符占1字节,8个二进制位占1字节,若压缩后文本不足8位,则按1字节算。输出从第二行开始,每行为1个字符的哈夫曼编码,按各字符在文本中出现次数递增顺序输出,若多个字符出现次数相同,则按其在文本出现先后排列。每行格式为“字母:编码”。最后两行为两行字符串,表示译码结果,若译码失败,则输出INVALID。
输入样例:
cbaxyyzz
0100
011
输出样例:
8 3
c:100
b:101
a:110
x:111
y:00
z:01
zy
INVALID
思路:先用优先队列建树,然后深搜探索出每个字符的编码,再对比特流进行译码即可。
AC代码:
#include<bits/stdc++.h>
using namespace std;
struct node{
char date;//记录字符
int HZ;//记录频率
int qz;//记录优先值
node* left;//左子树
node* right;//右子树
};
struct cmp{//优先队列排序规则
bool operator()(const node* x,const node* y){
if(x->HZ!=y->HZ)return x->HZ>y->HZ;
else return x->qz>y->qz;
}
};
string x,y,z;
int bj,wpl=0,jh;
map<char,int>mp,yxj;//记录频率和优先值
vector<char>ym;//记录译出的码
priority_queue<node*,vector<node*>,cmp>q,rnm;
map<char,vector<int> >bm;//记录各字符编码
vector<int>v;
void dfs(node* BT){
if(BT){
if(islower(BT->date)){
bm[BT->date]=v;
}
v.push_back(0);
dfs(BT->left);
v.pop_back();
v.push_back(1);
dfs(BT->right);
v.pop_back();
}
}
void ym(string x){//译码函数
();
node* t=new node;
t=();
jh=1;
for(int i=0;i<();i++){
if(x[i]=='0')t=t->left;
else t=t->right;
if((i==(()-1))&&isupper(t->date))jh=0;
if(islower(t->date)){
ym.push_back(t->date);
t=();
}
}
if(jh)for_each((),(),[](char x){cout<<x;});
else cout<<"INVALID";
cout<<endl;
}
int main(){
cin>>x>>y>>z;
for(auto k:x){
mp[k]++;
if(yxj[k]==0)yxj[k]=bj++;
}
for(auto k:mp){
node* t=new node;
t->date=;
t->HZ=;
t->qz=yxj[];
t->left=t->right=nullptr;
(t);
(t);
}
while(()!=1){//构建哈夫曼树
node* a=new node;
a=();
();
node* b=new node;
b=();
();
node* t=new node;
t->date='A';
t->qz=bj++;
t->HZ=a->HZ+b->HZ;
t->left=a;
t->right=b;
(t);
wpl+=t->HZ;
}
cout<<()<<" ";
int e=wpl/8;
if(e*8<wpl)e++;
cout<<e<<endl;
dfs(());
while(()){
char k=()->date;
cout<<k<<":";
for(auto r:bm[k]){
cout<<r;
}
();
cout<<endl;
}
ym(y);
ym(z);
return 0;
}