重编吗

问题描述

有一篇文章,文章包含 n 种单词,单词的编号从 1 至 n,第 i 种单词的出现次数为 w[i]。

现在,我们要用一个 2 进制串(即只包含 0 或 1 的串) s[i] 来替换第 i 种单词,使其满足如下要求:对于任意的 1≤i,j≤n(i≤j),都有 s[i] 不是 s[j] 的前缀。(这个要求是为了避免二义性)

你的任务是对每个单词选择合适的 s[i],使得替换后的文章总长度(定义为所有单词出现次数与替换它的二进制串的长度乘积的总和)最小。求这个最小长度。

字符串 S1(不妨假设长度为 n)被称为字符串 S2 的前缀,当且仅当:S2 的长度不小于 n,且 S1 与 S2 前 n 个字符组组成的字符串完全相同。

输入格式

第一行一个整数 n,表示单词种数。

第 2 行到第 n+1 行,第 i+1 行包含一个正整数 w[i],表示第 i 种单词的出现次数。

输出格式

输出一行一个整数,表示整篇文章重编码后的最短长度。

样例输入

4
1
1
2
2

输出样例

12

这是一道考察huffman编码的题目。

朴素的方法是构造huffman树,每一个叶子结点代表单词的出现次数(也就是权值)乘以节点在树中的深度,加总起来。

扫描二维码关注公众号,回复: 2763193 查看本文章

实现的过程有些麻烦。

后来被别人开了脑洞。。。woc,这题还能这样做

代码实现

#include <bits/stdc++.h>
using namespace std;
// ================= 代码实现开始 =================
typedef long long ll;
//pq:一个小顶堆优先队列,用于辅助后续计算
priority_queue<ll,vector<ll>,greater<ll> > pq;
// 这是求解整个问题的函数
// w:题目描述中的 w(所有)
// n:题目描述中的 n
// 返回值:答案
long long getAnswer(int n, vector<long long> w) {
    //将所有w加入优先队列pq中
    for(int i=0; i<n; ++i)
        pq.push(w[i]);
    ll sum = 0;//置零返回值
    while(pq.size()> 1){//当pq中仍有超过多少元素时进行循环呢?
            ll newEle = 0;//这是本次合并后将要加入队列的新元素
            //从pq中取出最小的两个元素并合并
            for(int k = 0; k<2; ++k){
                newEle += pq.top();
                pq.pop();//不能漏
            }
            sum += newEle;//将本次合并对答案的贡献加入答案
            pq.push(newEle);//将新元素加入队列
     }
     return sum;//返回答案
}

猜你喜欢

转载自blog.csdn.net/qq_39652552/article/details/81636702