问题描述

如何得到一个数据流中的中位数？如果从数据流中读出奇数个数值，那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值，那么中位数就是所有数值排序之后中间两个数的平均值。

简单分析

因为是从数据流中读出的数据，因此我们所拥有的数据的总数是随着时间的推移不断增长的，但是这个不是很重要，因为我们总有容器是可以装下的。
那么，如果说寻找中位数时，已经排好序了，那么就很简单。
但是如果每插入一次就排一次序的话，那么会比较麻烦。

概念

完全排序：将数据从头到尾全部按照从小到大（从大到小）排序
非完全排序：将数据进行部分排序，或者使得数据部分有序。

非完全排序

因此，需要分析一下题目，将排序的任务进行简化，降低运算量和工作量。

完全排序后的效果

首先，我们为了不考虑计算量，认为数据量极低，只有6个数据。此时按照完全排序的方法对整个数据进行一次排序，那么我们所得到的数据如下：
这里写图片描述
中位数：
中位数应当是（数据3+数据4）/ 2。

完全排序向非完全排序转化的关键思路！！

见证奇迹的时刻到了！
如果我们从数据3和数据4中间画一道线，则原先的整体数据分成了两个部分：
这里写图片描述
那么中位数就可以写成：（第一部分的最大值+第二部分的最小值）/ 2。
而根据完全排序的性质，我们可以得到下面的结论：
1. 第一部分所有值均小于等于等二部分
2. 第一部分最大值和第二部分最小值可以得到中位数

思路整理

综上，可以发现非完全排序的思路类似二路归并：
1. 将数据分为两个部分，其中第一部分所有值均小于等于等二部分。
2. 找到第一部分最大值和第二部分最小值。

【清奇思路（七）】寻找数据流的中位数