SSLOJ1407 【树】哈夫曼树(一)

Description

假设用于通信的电文仅由8个字母组成，字母在电文中出现的频率分别为7、19、2、6、32、3、21、10。试为这8个字母设计哈夫曼编码。如果用二进制数表示这8个字母的编码方案．（请按照左子树根节点的权小于等于右子树根节点的权的次序构造）

Input

第一行为字母的个数n；
第二行至第n+1行分别为各个字母在电文中出现的频率；

Output

按照中序遍历输出各个编码

Sample Input

8
7
19
2
6
32
3
21
10

Sample Output

19:00
21:01
2:10000
3:10001
6:1001
7:1010
10:1011
32:11

思路

哈夫曼编码板子题，首先我们要了解什么是哈夫曼编码。
主要应用在无损压缩方面，是一种通过特殊编码方式而在保证信息不会被错误翻译的情况下，靠频率来加快翻译速度的方法。
其要求为不能错误翻译且WPL（频率*二进制码长度之和）最小。

什么是不能错误翻译呢？举个例子：
A=01，B=010，C=101，D=10，E=0
010101001，你怎么翻？
AAAEA?EDDDA?ECBA?
显然是不行的，所以要更换编码。

A=001，B=10，C=010，D=111，E=101
同样是010101001，这时只能翻成CBA

为了保证二进制编码程度最短，我们需要用某种方法来构造哈夫曼编码。
哈夫曼编码对于哈夫曼树来说就是从根节点到某个节点的边集（向左走便是0，右边便是1）如A=001即从根节点去第一层左节点，再去第二层最左节点，然后去其在第三层的右儿子。

|那么我们还需要了解一下哈夫曼树。~~（烂番茄不要丢过来）~~

给定N个权值作为N个叶子结点，构造一棵二叉树，若该树的带权路径长度达到最小，称这样的二叉树为最优二叉树，也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树，权值较大的结点离根较近。

——某度百科

构造方法？见代码吧（~~臭鸡蛋可以丢过来了~~）

code:

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<string>
#include<cstring>
#include<queue> 
using namespace std;
struct f{
    
    
	int v,l,r;
} a[1000001];
int tot;
int x[10001];
int n;
string s;
void dfs(int x,int dep)
{
    
    
	if (a[x].l==0&&a[x].r==0)
	{
    
    
		cout<<a[x].v<<':';
		for (int i=0;i<dep;i++) cout<<s[i];
		cout<<endl;
		return;
	}
	if (a[x].l!=0)
	{
    
    
		s[dep]='0';
		dfs(a[x].l,dep+1);
	}
	if (a[x].r!=0)
	{
    
    
		s[dep]='1';
		dfs(a[x].r,dep+1);
	}
	return;
}
bool cmp(int c,int b)
{
    
    
	return a[c].v>a[b].v;
}
int main()
{
    
    
	cin>>n;
	for (int i=1;i<=n;i++)
	{
    
    
		cin>>a[i].v;
		x[i]=i;
	}
	sort(x+1,x+1+n,cmp);
	for (int i=n;i>1;i--)
	{
    
    
		int xx=n+n-i+1;
		a[xx].v=a[x[i]].v+a[x[i-1]].v;
		a[xx].l=x[i];
		a[xx].r=x[i-1];
		int j;
		for (j=i-1;j>0&&a[xx].v>a[x[j]].v;j--) x[j+1]=x[j];
		x[j+1]=xx;
	}
	dfs(n+n-1,0);
    return 0;
}