SSLOJ1407 【树】哈夫曼树(一)

Description

假设用于通信的电文仅由8个字母组成,字母在电文中出现的频率分别为7、19、2、6、32、3、21、10。试为这8个字母设计哈夫曼编码。如果用二进制数表示这8个字母的编码方案.(请按照左子树根节点的权小于等于右子树根节点的权的次序构造)

Input

第一行为字母的个数n;
第二行至第n+1行分别为各个字母在电文中出现的频率;

Output

按照中序遍历输出各个编码

Sample Input

8
7
19
2
6
32
3
21
10

Sample Output

19:00
21:01
2:10000
3:10001
6:1001
7:1010
10:1011
32:11

思路

哈夫曼编码板子题,首先我们要了解什么是哈夫曼编码。
主要应用在无损压缩方面,是一种通过特殊编码方式而在保证信息不会被错误翻译的情况下,靠频率来加快翻译速度的方法。
其要求为不能错误翻译且WPL(频率*二进制码长度之和)最小。


什么是不能错误翻译呢?举个例子:
A=01,B=010,C=101,D=10,E=0
010101001,你怎么翻?
AAAEA?EDDDA?ECBA?
显然是不行的,所以要更换编码。

A=001,B=10,C=010,D=111,E=101
同样是010101001,这时只能翻成CBA


为了保证二进制编码程度最短,我们需要用某种方法来构造哈夫曼编码。
哈夫曼编码对于哈夫曼树来说就是从根节点到某个节点的边集(向左走便是0,右边便是1)如A=001即从根节点去第一层左节点,再去第二层最左节点,然后去其在第三层的右儿子。


|那么我们还需要了解一下哈夫曼树。(烂番茄不要丢过来)

给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。
——某 度 百 科

构造方法?见代码吧(臭鸡蛋可以丢过来了


code:

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<string>
#include<cstring>
#include<queue> 
using namespace std;
struct f{
    
    
	int v,l,r;
} a[1000001];
int tot;
int x[10001];
int n;
string s;
void dfs(int x,int dep)
{
    
    
	if (a[x].l==0&&a[x].r==0)
	{
    
    
		cout<<a[x].v<<':';
		for (int i=0;i<dep;i++) cout<<s[i];
		cout<<endl;
		return;
	}
	if (a[x].l!=0)
	{
    
    
		s[dep]='0';
		dfs(a[x].l,dep+1);
	}
	if (a[x].r!=0)
	{
    
    
		s[dep]='1';
		dfs(a[x].r,dep+1);
	}
	return;
}
bool cmp(int c,int b)
{
    
    
	return a[c].v>a[b].v;
}
int main()
{
    
    
	cin>>n;
	for (int i=1;i<=n;i++)
	{
    
    
		cin>>a[i].v;
		x[i]=i;
	}
	sort(x+1,x+1+n,cmp);
	for (int i=n;i>1;i--)
	{
    
    
		int xx=n+n-i+1;
		a[xx].v=a[x[i]].v+a[x[i-1]].v;
		a[xx].l=x[i];
		a[xx].r=x[i-1];
		int j;
		for (j=i-1;j>0&&a[xx].v>a[x[j]].v;j--) x[j+1]=x[j];
		x[j+1]=xx;
	}
	dfs(n+n-1,0);
    return 0;
}

猜你喜欢

转载自blog.csdn.net/weixin_49843717/article/details/114989401