数据存储于分析

磁盘的读写,一直未能跟着时代发展。1990时代,普通硬盘有1370MB左右的空间,而速度4.4MB/S,而此速度要读取全部数据,5分钟差不多了。而如今1TB的很正常,但是速度只有100MB/S左右,因此读取1TB速度,可能需要两个半小时。而写则更慢。

比较简单的优化方式,可以将1TB数据分散到不同磁盘,比如100个磁盘,每次读取数据,可以让多个磁盘同时进行,那么时间可能被所小100倍(最完美情况)。因此(假设数据是以文件划分的),可以对每个数据进行磁盘分割。该方案需要保证数据的可用,就需要对每个磁盘进行冗余备份,来防止当一个磁盘出现问题,有恢复机制(RAID备份机制就是一种)。

猜你喜欢

转载自liyixing1.iteye.com/blog/2221317