Datanode占用磁盘IO高问题 - 代码天地

Datanode占用磁盘IO高问题

其他 2019-03-20 15:09:49 阅读次数: 0

hadoop集群版本：hadoop-2.7.2

问题现象：

iotop排查有大量的du -sk 操作占用IO比较高，且执行很长时间；

iostat -x 5：磁盘IOutil 一直处于比较高的使用率，且iowait值比较大，io有一定的等待延迟；

问题原因：

Datanode进程启动时，启动DU线程定期执行du –sk命令统计各blockpool目录的占用情况，随着心跳汇报给namenode。

执行周期默认为600000ms，配置项为fs.du.interval;

所以，对于DN来说，默认的Du，会产生大量的du -sk的操作，会造成集群严重的IO Wait增加，从而导致任务会变得缓慢。

相关代码：

解决方案（优化）：

社区优化方案：

使用 df 命令替换 du；
增加检查间隔时间随机抖动机制；（将一个节点上同时产生的多个du操作，加个随机数，随机到集群的不同时间段，）

Fix version: 2.8.0, 3.0.0-alpha1

相关patch：

https://issues.apache.org/jira/browse/HADOOP-9884

https://issues.apache.org/jira/browse/HADOOP-12973

https://issues.apache.org/jira/browse/HADOOP-12974

https://issues.apache.org/jira/browse/HADOOP-12975

相关代码截图：

临时优化方案：

增加fs.du.interval 磁盘检测时间间隔，调整至适当大的值30min，尽量减缓这种io占用高的情况

<property>

<name>fs.du.interval</name>

<value>1800000</value>

</property>

Linux 上捕获到hdfs调用的 du -sk 命令，使用 df -k 进行替换

tip: 这个方法的前提是每个BP目录单独位于一个磁盘上。

du 脚本，对正常的du命令不进行修改

问题：应用df 替换du会有一定的数据差异；

执行机制不同： Linux df和du执行原理机制的不同，du的数据是基于文件获取的，并非针对某个分区，执行时间受限于文件和目录个数；df直接使用 statfs系统调用，直接读取分区的超级块信息获取分区使用情况，针对整个分区，直接读取超级块，运行速度不受文件目录个数影响，执行很快。
du和df不一致情况: 常见的df和du不一致情况就是文件删除的问题。当一个文件被删除后，在文件系统目录中已经不可见了，所以du就不会再统计它了。然而如果此时还有运行的进程持有这个已经被删除了的文件的句柄，那么这个文件就不会真正在磁盘中被删除，分区超级块中的信息也就不会更改。这样df仍旧会统计这个被删除了的文件。

猜你喜欢

转载自blog.csdn.net/breakout_alex/article/details/87970360

Datanode占用磁盘IO高问题

解决zookeeper磁盘IO高的问题

distcp解决HDFS部分Datanode空间占用率高的问题

一次磁盘IO高的问题处理

linux查看哪个进程占用磁盘IO

Linux 查看磁盘IO并找出占用IO读写很高的进程

jbd2导致磁盘io使用率高问题分析

录包磁盘IO高导致系统卡顿问题排查

磁盘IO问题分析工具

解决内存占用高的问题

Hadoop datanode磁盘扩容

Linux 查看哪些进程占用磁盘IO （iotop工具）

mysql占用磁盘IO过高的解决办法

转：mysql占用磁盘IO过高的解决办法

【Hadoop故障处理】高可用（HA）环境DataNode问题

centos磁盘占用过高问题

文件句柄未释放，磁盘占用问题

Windows 磁盘占用率高的解决方法

在DataNode主机上替换磁盘

【原创】大叔问题定位分享（29）datanode启动报错：50020端口被占用

centos 7 查看磁盘io ，找出占用io读写很高的进程

三招解决MongoDB的磁盘IO问题

Java高CPU占用问题排查

TSVNCache.exe占用CPU高的问题

Java高内存占用问题排查

Windbg分析高内存占用问题

排查java进程cpu占用高的问题

Hisi内核线程CPU占用高的问题

java进程占用CPU高的问题

HDFS Datanode 磁盘间均衡（加磁盘）

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)