GFS chunk块大小为什么选择64M
优点:
- 减少master存储的元数据信息,因为元数据要放到内存以提供快速访问。如果太小元数据就会太多。
- 减少客户端与master的交互次数。
- 客户端可以与master保持较长的连接
不足:
- chunk size越大时,可能对部分文件来讲只有1个chunk,那么这个时候对该文件的读写就会落到一个chunkserver上,成为热点。
改善:
- 对于热点问题,google给出的解决方案是应用层避免高频地同时读写同一个chunk。还提出了一个可能的解决方案是,GFS client找其他的GFS client来读数据