一 TopK
原文链接:
https://blog.csdn.net/z50L2O08e2u4afToR9A/article/details/82837278
TopK——求前K个最大或最小的数。
- 全局排序:前K个数一目了然。
- 局部排序:只需要得到前K个数,没必要对数据进行全局排序,故可使用冒泡排序,只排序前K个数,每冒泡一次就得到一个最大值。时间复杂度为:O(n*k)
- 堆:若只需得到前K个数,而不考虑对这K个数进行排序,则可以借助堆进行求解TopK问题。
即:
找最大的前K个数,则建立一个小堆。
找最小的前K个数,则建立一个大堆。 - 分治法:每个区间“都要”递归排序,例如:快速排序,O(n*lg(n))
- 减治法,“只要”递归排序一个区间,例如:二分查找O(lg(n)),随机选择O(n)。
若使用快速排序(从大到小)时,区间划分的基准为pivot
pivot = partition(arr, low, high);
如果pivot大于k,则说明arr[pivot] 左边的元素都大于k,于是只递归arr[1, pivot-1] 里第k大的元素即可;
如果pivot小于k,则说明说明第k大的元素在arr[pivot]的右边,于是只递归arr[pivot+1, n] 里第k-pivot大的元素即可。
bitmap计数:空间换时间——计数排序
https://blog.csdn.net/z50L2O08e2u4afToR9A/article/details/82837280