题目描述
为了不断优化推荐效果,内涵段子(段友出征,寸草不生)每天要存储和处理海量数据。
假设有这样一种场景:我们对用户按照它们的注册时间先后来标号,对于一类文章,每个用户都有不同的喜好值,我们会想知道某一段时间内注册的用户(标号相连的一批用户)中,有多少用户对这类文章喜好值为k。
因为一些特殊的原因,不会出现一个查询的用户区间完全覆盖另一个查询的用户区间(不存在L
1<=L
2<=R
2<=R
1)
输入描述:
第1行为n代表用户的个数 第2行为n个整数,其中第i个数代表用户标号为i的用户对某类文章的喜好度 第3行为一个正整数q代表查询的组数 第4行到第(3+q)行,每行包含3个整数l,r,k代表一组查询,即标号为l<=i<=r的用户中对这类文章喜好值为k的用户的个数。 数据范围n <= 300000,q<=300000 ,k是整型
输出描述:
一共q行,每行一个整数代表喜好值为k的用户的个数
示例1
输入
5 1 2 3 3 5 3 1 2 1 2 4 5 3 5 3
输出
1 0 2
数据很大,询问300000
次,那么每次询问对应的操作的时间复杂度必须是O(1)O(1)或O(logn)O(logn);
这就为我们思考算法提供了方向,O(1)O(1)显然是不可能的,那么操作的时间复杂度为O(logn)O(logn)的算法只能是二分查找了,因此,你从这个时间复杂度联想到二分查找,那么这个题你就差不多做出来了;
二分的要求是序列有序,因此不管那么多,先排序,可是按照什么东西来排序呢?由于题目要求在一个时间范围内喜好为k
的有多少人,那么可以把相同k
值的人放到一起形成一个子序列,然后再根据时间的范围在这个子序列中查找,因此用结构体的二级排序,先按k
值的大小升序排序,如果k
值相同,再按时间顺序升序排序;
bool sort_cmp(const pair<int, int> &A, const pair<int, int> &B) { return A.first == B.first ? A.second < B.second : A.first < B.first; }
这样的二级排序是稳定排序,故排序后整个序列是k
值升序的,各个子序列中的时间也是升序的。
排好序后,就是查找的过程,先用equal_range
找到序列中k
值为目标k
值的子序列,然后用lower_bound
与upper_bound
在子序列中找到目标时间范围内的最长子序列(用lower_bound
找到第一个大于或等于左端点的位置,用upper_bound
找到最后一个小于或等于右端点的位置),比如目标时间范围是[3, 7]
,那么假设最大子序列为[4, 5]
,[4,5]⊂[3,7][4,5]⊂[3,7],答案就是最长子序列的长度。
如果这个过程还是不清楚,看下图:
equal_range
、lower_bound
、upper_bound
这三个函数的时间复杂度都为O(logn)O(logn),因此问题得到解决。
题解转载自 https://blog.csdn.net/flushhip/article/details/79416715
#include<bits/stdc++.h> using namespace std; typedef long long ll; const int maxn = 3e5+10; struct Person { ll val; int id; bool operator < (const struct Person &a) { if(val == a.val) return id < a.id; return val < a.val; } }; Person persons[maxn]; ll arr[maxn]; int ids[maxn]; int main() { int n; while(~scanf("%d",&n)) { for(int i=0;i<n;i++) scanf("%lld",&persons[i].val),persons[i].id = i+1; sort(persons,persons+n); for(int i=0;i<n;i++) arr[i] = persons[i].val,ids[i] = persons[i].id; int q,l,r; ll k; scanf("%d",&q); while(q--) { scanf("%d%d%lld",&l,&r,&k); int le = lower_bound(arr,arr+n,k)-arr,ri = upper_bound(arr,arr+n,k)-arr; int l1 = lower_bound(ids+le,ids+ri,l)-ids,r1 = upper_bound(ids+le,ids+ri,r)-ids-1; printf("%d\n",r1 - l1 + 1); } } return 0; }