【SSL】1407【树】哈夫曼树(一)
Time Limit:1000MS
Memory Limit:65536K
Description
假设用于通信的电文仅由8个字母组成,字母在电文中出现的频率分别为7、19、2、6、32、3、21、10。试为这8个字母设计哈夫曼编码。如果用二进制数表示这8个字母的编码方案.(请按照左子树根节点的权小于等于右子树根节点的权的次序构造)
Input
第一行为字母的个数n;
第二行至第n+1行分别为各个字母在电文中出现的频率;
Output
按照中序遍历输出各个编码
Sample Input
8
7
19
2
6
32
3
21
10
Sample Output
19:00
21:01
2:10000
3:10001
6:1001
7:1010
10:1011
32:11
思路
构造哈夫曼树
中序遍历递归输出
构造哈夫曼树的基本思想是要让权大的叶子离根最近。
具体作法是:
(1)根据给定的n个权值{w1,w2,…,wn},构造n棵二叉树的集合F={T1,T2,…,Tn},其中每棵二叉树中均只含一个带权值为wi的根结点,其左、右子树为空树;
(2)在F中选取其根结点的权值为最小的两棵二叉树,分别作为左、右子树构造一棵新的二叉树,并置这棵新的二叉树根结点的权值为其左、右子树根结点的权值之和;
(3)从F中删去这两棵树,同时加入刚生成的新树;
(4)重复(2)和(3)两步,直到F中只含一棵树为止。
从上述算法中可以看出,F实际上是森林,该算法的思想是不断地进行森林F中的二叉树的“合并”,最终得到哈夫曼树。
实际上,哈夫曼算法的实现与实际问题所采用的存储结构有关。现假设用数组F来存储哈夫曼树,其中第i个数组元素F[i]是哈夫曼树中的一个结点,其地址为i,有3个域,Data域存放该结点的权值,lChild域和rChild域分别存放该结点左、右子树的根结点的地址(下标)。在初始状态下: F[i].Data=Wi,F[i].lChild=F[i].rChild=0,i=1,2,…,n。
代码
#include<iostream>
#include<cstdio>
#include<algorithm>
using namespace std;
char ans[2010]="";
struct tree
{
int s,l,r;//s权值,l左子树地址,r右子树地址
}a[2010];
int b[2010];//a中地址
bool cmp(int x,int y)
{
return a[x].s>a[y].s;
}
void print(int x,int dep)//中序遍历输出
{
if(a[x].l==0&&a[x].r==0)//叶子节点
printf("%d:%s\n",a[x].s,ans);
if(a[x].l>0)
{
ans[dep+1]=0;
ans[dep]='0';
print(a[x].l,dep+1);//输出左子树
}
if(a[x].r>0)
{
ans[dep+1]=0;
ans[dep]='1';
print(a[x].r,dep+1);//输出右子树
}
return;
}
int main()
{
int n,i,j,w;
scanf("%d",&n);
for(i=1;i<=n;i++)
scanf("%d",&a[i].s),a[i].l=a[i].r=0,b[i]=i;
sort(b+1,b+n+1,cmp);//排序
for(i=n;i>1;i--)
{
w=n+n-i+1;
a[w].s=a[b[i]].s+a[b[i-1]].s;//合并
a[w].l=b[i];
a[w].r=b[i-1];
for(j=i-1;j>0&&a[w].s>a[b[j]].s;b[j+1]=b[j],j--);//插入排序
b[j+1]=w;
}
print(n+n-1,0);
return 0;
}