堆,是一种数据结构,可以看作一棵树的数组对象。看似是一棵树,但其本质是一个数组。
堆总是满足的情况:~堆中的某个节点的值总是不大于或不小于其父亲节点的值;
~堆总是一棵完全二叉树;
大堆:大堆就是每一个孩子节点总是不大于他的父亲节点,但孩子节点的左右没有大小之分。
小堆:小堆就是每一个孩子节点总是不小于他的父亲节点,同样孩子节点左右没有大小之分。如下图所示
实现大小堆其实主要是一个向下调整的过程,如图所示:
具体实现代码如下:
void AdjustDown(int *a, int size, int root)
{
int parent = root;
int child = parent * 2 + 1;
while (child < size)
{
if (child + 1 <= size && a[child] < a[child + 1])
{
++child;
}
if (a[child]>a[parent])
{
swap(a[child], a[parent]);
parent = child;
child = parent * 2 + 1;
}
else
{
break;
}
}
}
在用堆进行push操作时也需要对堆就行重新调整,即将新加入到数组的最后一个元素进行向上调整,过程如下:
完整代码如下:
void _adjustUp(int n)
{
compare com;
int child = n;
int parent = (n - 1) / 2;
if (_a[child] < _a[parent])
{
return;
}
while (child > 0)
{
if (com(_a[child],_a[parent]))
{
swap(_a[child],_a[parent]);
child = parent;
parent = (parent - 1) / 2;
}
else
{
break;
}
}
}
下面是heap的完整代码:
template<class T>
struct Less
{
bool operator()(const T&l, const T&r)
{
return l < r;
}
};
template<class T>
struct Greater
{
bool operator()(const T&l, const T&r)
{
return l>r;
}
};
template<class T,class compare>
class Heap
{
public:
Heap()
{
}
Heap(const T* a, size_t n)
{
_a.reserve(n);
for (size_t i = 0; i < n; i++)
{
_a.push_back(a[i]);
}
for (int i = (_a.size() -2) / 2; i >= 0; i--)
{
_adjustDown(i);
}
}
void push(T value)
{
_a.push_back(value);
_adjustUp(_a.size()-1);
}
void pop()
{
if (_a.size() == 0)
{
return;
}
//交换第一个和最后一个元素
swap(_a[0], _a[_a.size() - 1]);
//将数组size减一,即原来的第一个元素
_a.pop_back();
//向下调整
_adjustDown(0);
}
protected:
//向下调整
void _adjustDown(int root)
{
compare com;
int parent = root;
int child = root * 2 + 1;
while (child< _a.size())
{
if (child+1<=_a.size() && com(_a[child+1],_a[child]))
{
++child;
}
if (com(_a[child],_a[parent]))
{
swap(_a[child], _a[parent]);
parent=child;
child = child*2+1;
}
else
{
break;
}
}
}
//向上调整
void _adjustUp(int n)
{
compare com;
int child = n;
int parent = (n - 1) / 2;
if (_a[child] < _a[parent])
{
return;
}
while (child > 0)
{
if (com(_a[child],_a[parent]))
{
swap(_a[child],_a[parent]);
child = parent;
parent = (parent - 1) / 2;
}
else
{
break;
}
}
}
protected:
vector<T> _a;
};
堆排序
思想:这里首先将数组元素向下调整成大堆,此时堆顶元素是所有元素最大的,我们将堆顶和数组最后一个元素交换,将此时的堆顶元素进行向下调整,这是数组最后一个元素就是最大的元素,而此时的堆顶是次大的元素,然后我们重复上面交换和调整,这样调整完一遍数组我们就完成了排序,是这样数组变得有序了(这里以大堆为例)。如下图所示:
堆排序代码如下:
void HeapSort(int *a, int size)
{
//建堆
for (int i = (size - 2) / 2; i >= 0; --i)
{
AdjustDown(a, size, i);
}
//排序
size_t end = size - 1;
while (end>0)
{
swap(a[0], a[end]);
AdjustDown(a, end-1 , 0);
end--;
}
}
TopK问题:
思路:首先建立一个k个节点的小堆,此时堆顶元素是这k个元素中最小的元素,然后将下一个入堆的元素与堆顶进行比较,如果小于堆顶则这个元素一定不是最大的倒数k个元素中的一个,如果大于堆顶则将用这个元素代替堆顶元素,这里不是push进来新的元素而是将堆顶元素替换掉,还是k个元素的堆,然后进行调整,然后下一个入堆的元素重复上述的过程,最后留在这个k个元素的堆里面的元素,一定就是最大的倒数k个元素了,如下图所示:
topK问题代码如下:
void topK(int a[], int size, int k)
{
for (int i = (k - 2) / 2; i >= 0; --i)
{
//建个k个元素的小堆
AdjustDownSmall(a, k, i);
}
for (int i = k; i < size; ++i)
{
if (a[0] < a[i])
{
swap(a[0], a[i]);
AdjustDownSmall(a, k, 0);
}
}
}
如有错误,欢迎指出。