【清奇思路(七)】寻找数据流的中位数

问题描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

简单分析

  1. 因为是从数据流中读出的数据,因此我们所拥有的数据的总数是随着时间的推移不断增长的,但是这个不是很重要,因为我们总有容器是可以装下的。
  2. 那么,如果说寻找中位数时,已经排好序了,那么就很简单。
    但是如果每插入一次就排一次序的话,那么会比较麻烦。

概念

完全排序:将数据从头到尾全部按照从小到大(从大到小)排序
非完全排序: 将数据进行部分排序,或者使得数据部分有序。

非完全排序

因此,需要分析一下题目,将排序的任务进行简化,降低运算量和工作量。

完全排序后的效果

首先,我们为了不考虑计算量,认为数据量极低,只有6个数据。此时按照完全排序的方法对整个数据进行一次排序,那么我们所得到的数据如下:
这里写图片描述
中位数
中位数应当是(数据3+数据4)/ 2。

完全排序向非完全排序转化的关键思路!!

见证奇迹的时刻到了!
如果我们从数据3和数据4中间画一道线,则原先的整体数据分成了两个部分:
这里写图片描述
那么中位数就可以写成:(第一部分的最大值+第二部分的最小值)/ 2。
而根据完全排序的性质,我们可以得到下面的结论:
1. 第一部分所有值均小于等于等二部分
2. 第一部分最大值和第二部分最小值可以得到中位数

思路整理

综上,可以发现非完全排序的思路类似二路归并:
1. 将数据分为两个部分,其中第一部分所有值均小于等于等二部分。
2. 找到第一部分最大值和第二部分最小值。

猜你喜欢

转载自blog.csdn.net/wushuomin/article/details/80620756