1 题目描述

如何得到一个数据流中的中位数？如果从数据流中读出奇数个数值，那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值，那么中位数就是所有数值排序之后中间两个数的平均值。

例如，
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构：

void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。

示例1：

输入：
["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]
[[],[1],[2],[],[3],[]]
输出：[null,null,null,1.50000,null,2.00000]

示例2：

输入：
["MedianFinder","addNum","findMedian","addNum","findMedian"]
[[],[2],[],[3],[]]
输出：[null,null,2.00000,null,2.50000]

限制：

最多会对 addNum、findMedian 进行 50000 次调用。

2 解题思路

给定一长度为N的无序数组，其中位数的计算方法：首先对数组执行排序（使用O(NlogN)时间），然后返回中间元素即可（使用O(1)时间）。

针对本题，根据以上思路，可以将数据流保存在一个列表中，并在添加元素时保持数组有序。此方法的时间复杂度为O(N)，其中包括：查找元素插入位置O(logN)（二分查找）、向数组某位置插入元素O(N)（插入位置之后的元素都需要向后移动一位）。

借助堆可进一步优化时间复杂度。

建立一个小顶堆A和大顶堆B，各保存列表的一半元素，且规定：

A保存较大的一半，长度为 $\over 2$ （N为偶数）或 $\over 2$ （N为奇数）；
B保存较小的一半，长度为 $\over 2$ （N为偶数）或 $\over 2$ （N为奇数）；

随后，中位数可仅根据A，B的堆顶元素计算得到。
在这里插入图片描述
算法流程：

设元素总数为N=m+n，其中m和n分别为A和B中的元素个数。

addNum(num)函数：

当m=n（即N为偶数）：需向A添加一个元素。实现方法：将新元素num插入至B，再将B堆顶元素插入至A；
当 $\neq n$ （即N为奇数）：需向B添加一个元素。实现方法：将新元素num插入至A，再将A堆顶元素插入至B；

假设插入数字num遇到情况1.。由于num可能属于“较小的一半”（即属于B），因此不能将nums直接插入至A。而应先将num插入至B，再将B堆顶元素插入至A。这样就可以始终保持A保存较大一半、B保存较小一半。

findMedian()函数：

当 $m = n$ （N为偶数）：则中位数为（A的堆顶元素+B的堆顶元素）/2。
当 $\neq n$ （N为奇数）：则中位数为A的堆顶元素。

class MedianFinder {
    
    
    Queue<Integer> A,B;
    /** initialize your data structure here. */
    public MedianFinder() {
    
    
        A = new PriorityQueue<>();
        B = new PriorityQueue<>((x,y)->(y-x));
    }
    
    public void addNum(int num) {
    
    
        if (A.size() == B.size()) {
    
    
            B.offer(num);
            A.offer(B.poll());
        }
        else {
    
    
            A.offer(num);
            B.offer(A.poll());
        }
    }
    
    public double findMedian() {
    
    
        return A.size() == B.size() ? (A.peek() + B.peek()) / 2.0 : A.peek();
    }
}

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder obj = new MedianFinder();
 * obj.addNum(num);
 * double param_2 = obj.findMedian();
 */

复杂度分析：

时间复杂度：
- 查找中位数 O(1) ：获取堆顶元素使用 O(1) 时间；
- 添加数字 O(logN) ：堆的插入和弹出操作使用 O(logN) 时间。
空间复杂度 O(N) ：其中 N 为数据流中的元素数量，小顶堆 A 和大顶堆 B 最多同时保存 N 个元素。

41题-数据流中的中位数

1 题目描述

2 解题思路

猜你喜欢