《剑指offer》刷题系列——(五十九)数据流中的中位数

题目

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:

void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。

示例 :
输入:
[“MedianFinder”,“addNum”,“addNum”,“findMedian”,“addNum”,“findMedian”]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]

思路

建立一个 小顶堆 A 和 大顶堆 B ,各保存列表的一半元素。
小顶堆保存整个数据流中较大的一部分,大顶堆保存较小的一部分。

当A和B的长度相同时,添加值num插入到A中。为了保证A中的元素始终是整个数据流中较大的一部分,需要先把num插入到B中,然后再插入到A。
当A和B的长度不同时,添加值num插入到B中。也是需要先插入A中,再插入B中。

当A和B的长度相同时,此时数据流中共有偶数个数,中位数就是两个堆顶的平均值;
当A和B的长度不同时,此时数据流中共有奇数个数,中位数是小顶堆的堆顶值。

代码

class MedianFinder:

    def __init__(self):
        """
        initialize your data structure here.
        """
        self.A = []
        self.B = []

    def addNum(self, num: int) -> None:
        if len(self.A)==len(self.B):
            heapq.heappush(self.B,-num)
            heapq.heappush(self.A, -heapq.heappop(self.B))
        else:
            heapq.heappush(self.A,num)
            heapq.heappush(self.B, -heapq.heappop(self.A))

    def findMedian(self) -> float:
        if len(self.A)==len(self.B):
            return (self.A[0]-self.B[0])/2
        else: return self.A[0]



# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()

复杂度

时间复杂度:
查找中位数 O(1): 获取堆顶元素使用 O(1)时间;
添加数字 O(log⁡N): 堆的插入和弹出操作使用 O(log⁡N) 时间。

空间复杂度 O(N): 其中 N为数据流中的元素数量,小顶堆 A 和大顶堆 B 最多同时保存 N 个元素。

猜你喜欢

转载自blog.csdn.net/weixin_44776894/article/details/107481062