7-5 哈夫曼树 (20分)

时间:2025-03-14 07:51:41

题目描述:

编写一个哈夫曼编码译码程序。针对一段文本,根据文本中字符出现频率构造哈夫曼树,给出每个字符的哈夫曼编码,并进行译码,计算编码前后文本大小。
为确保构建的哈夫曼树唯一,本题做如下限定:

  1. 选择根结点权值最小的两棵二叉树时,选取权值较小者作为左子树。
  2. 若多棵二叉树根结点权值相等,则先生成的作为左子树,后生成的作为右子树,具体来说:i) 对于单结点二叉树,优先选择根结点对应字母在文本中最先出现者,如文本为cba,三个字母均出现1次,但c在文本中最先出现,b第二出现,故则选择c作为左子树,b作为右子树。ii) 对于非单结点二叉树,先生成的二叉树作为左子树,后生成的二叉树作为右子树。iii. 若单结点和非单结点二叉树根结点权值相等,优先选择单结点二叉树。
  3. 生成哈夫曼编码时,哈夫曼树左分支标记为0,右分支标记为1。

输入格式:

输入为3行。第1行为一个字符串,包含不超过5000个字符,至少包含两个不同的字符,每个字符为a-z的小写字母。第2、3行为两个由0、1组成的字符串,表示待译码的哈夫曼编码。

输出格式:

输出第一行为用空格间隔的2个整数,分别为压缩前后文本大小,以字节为单位,一个字符占1字节,8个二进制位占1字节,若压缩后文本不足8位,则按1字节算。输出从第二行开始,每行为1个字符的哈夫曼编码,按各字符在文本中出现次数递增顺序输出,若多个字符出现次数相同,则按其在文本出现先后排列。每行格式为“字母:编码”。最后两行为两行字符串,表示译码结果,若译码失败,则输出INVALID。

输入样例:

cbaxyyzz
0100
011

输出样例:

8 3
c:100
b:101
a:110
x:111
y:00
z:01
zy
INVALID

 思路:先用优先队列建树,然后深搜探索出每个字符的编码,再对比特流进行译码即可。

AC代码:

#include<bits/stdc++.h>
using namespace std;
struct node{
	char date;//记录字符
	int HZ;//记录频率
	int qz;//记录优先值
	node* left;//左子树
	node* right;//右子树
};
struct cmp{//优先队列排序规则
	bool operator()(const node* x,const node* y){
		if(x->HZ!=y->HZ)return x->HZ>y->HZ;
		else return x->qz>y->qz;
	}
};
string x,y,z;
int bj,wpl=0,jh;
map<char,int>mp,yxj;//记录频率和优先值
vector<char>ym;//记录译出的码
priority_queue<node*,vector<node*>,cmp>q,rnm;
map<char,vector<int> >bm;//记录各字符编码
vector<int>v;
void dfs(node* BT){
	if(BT){
		if(islower(BT->date)){
			bm[BT->date]=v;
		}
		v.push_back(0);
		dfs(BT->left);
		v.pop_back();
		v.push_back(1);
		dfs(BT->right);
		v.pop_back();
	}
}
void ym(string x){//译码函数
	();
	node* t=new node;
	t=();
	jh=1;
	for(int i=0;i<();i++){
		if(x[i]=='0')t=t->left;
		else t=t->right;
		if((i==(()-1))&&isupper(t->date))jh=0;
		if(islower(t->date)){
			ym.push_back(t->date);
			t=();
		}
	}
	if(jh)for_each((),(),[](char x){cout<<x;});
	else cout<<"INVALID";
	cout<<endl;
}
int main(){
	cin>>x>>y>>z;
	for(auto k:x){
		mp[k]++;
		if(yxj[k]==0)yxj[k]=bj++;
	}
	for(auto k:mp){
		node* t=new node;
		t->date=;
		t->HZ=;
		t->qz=yxj[];
		t->left=t->right=nullptr; 
		(t);
		(t);
	}
	while(()!=1){//构建哈夫曼树
		node* a=new node;
		a=();
		();
		node* b=new node;
		b=();
		();
		node* t=new node;
		t->date='A';
		t->qz=bj++;
		t->HZ=a->HZ+b->HZ;
		t->left=a;
		t->right=b;
		(t);
		wpl+=t->HZ;
	}
    cout<<()<<" ";
    int e=wpl/8;
    if(e*8<wpl)e++;
    cout<<e<<endl;
	dfs(());
	while(()){
		char k=()->date;
		cout<<k<<":";
		for(auto r:bm[k]){
			cout<<r;
		}
		();
		cout<<endl;
	}
	ym(y);
	ym(z);
	return 0;
}