问题描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
简单分析
- 因为是从数据流中读出的数据,因此我们所拥有的数据的总数是随着时间的推移不断增长的,但是这个不是很重要,因为我们总有容器是可以装下的。
- 那么,如果说寻找中位数时,已经排好序了,那么就很简单。
但是如果每插入一次就排一次序的话,那么会比较麻烦。
概念
完全排序:将数据从头到尾全部按照从小到大(从大到小)排序
非完全排序: 将数据进行部分排序,或者使得数据部分有序。
非完全排序
因此,需要分析一下题目,将排序的任务进行简化,降低运算量和工作量。
完全排序后的效果
首先,我们为了不考虑计算量,认为数据量极低,只有6个数据。此时按照完全排序的方法对整个数据进行一次排序,那么我们所得到的数据如下:
中位数:
中位数应当是(数据3+数据4)/ 2。
完全排序向非完全排序转化的关键思路!!
见证奇迹的时刻到了!
如果我们从数据3和数据4中间画一道线,则原先的整体数据分成了两个部分:
那么中位数就可以写成:(第一部分的最大值+第二部分的最小值)/ 2。
而根据完全排序的性质,我们可以得到下面的结论:
1. 第一部分所有值均小于等于等二部分
2. 第一部分最大值和第二部分最小值可以得到中位数
思路整理
综上,可以发现非完全排序的思路类似二路归并:
1. 将数据分为两个部分,其中第一部分所有值均小于等于等二部分。
2. 找到第一部分最大值和第二部分最小值。