Hadoop的data.dir配置导致balancer无法平衡各节点 - 代码天地

Hadoop的data.dir配置导致balancer无法平衡各节点

企业开发 2018-05-14 15:25:16 阅读次数: 2

hdfs的data.dir配置如下：

<property>
  <name>dfs.data.dir</name>
  <value>/diska/data/hadoop/data1,/diska/data/hadoop/data2</value>
 </property>

后来在web界面的live nodes中看到，怎么hadoop配置的可用空间比实际的空间要多一倍，所以推测，hadoop不会检测是否相同的盘，只单独计算data.dir配置的每个目录的总容量，简单相加。

因为要运行balancer，但发现log显示信息都正确，也表明要copy block到比较均衡的机器，但实际上却没有发生block的拷贝。

把data.dir修改正确后，balancer能正确均衡集群了。

bin/start-balancer.sh默认的一个判断是否均衡的阀值是10%，也就是说，各个节点间使用率的偏差不超过10%。

PS: hadoop中第dfs.replication设置第数量如果跟机器数一样，则也不能balance，因为这时每台机都已经有一个拷贝，就不会在复制。

从balancer的后台输出中看到，移动block时总是from ... to ... through ...，也就是说，会以一台中间节点来转移数据，但这只是表面看到的情况，实际情况是，through的这台节点，其实是包含要移动block的一个copy，并且是已经balanced的节点。这样的话，移动block就不必真的从非balanced的节点移动，减轻了要移动block的节点第压力。

猜你喜欢

转载自blackwing.iteye.com/blog/1607713

Hadoop的data.dir配置导致balancer无法平衡各节点

hadoop集群dfs.data.dir目录权限问题导致节点无法启动

Hadoop中各节点的含义

优化Hadoop Balancer平衡的速度

记一次hadoop.tmp.dir配置因重启机器导致无法启动

(转)hadoop balancer（重新平衡）

Hadoop记录-HDFS balancer配置

Hadoop: Output data to mutiple dir

centos7中hadoop各节点时间同步方法

hadoop balancer

OpenStack部署（使用openvswitch）各节点具体配置信息

配置集群各节点SSH无密钥登陆

各节点集群方案

ES索引主分片在各节点分配不平衡处置方法

hadoop错误- slave节点无法启动data node数据节点进程，但是master节点datanode正常启动

搭建zookeeper集群各节点拒接连接，集群无法启动

hadoop dir

POM文件各节点说明

hadoop中的balancer

Hadoop HDFS Balancer介绍

hadoop-hdfs-Balancer

JSP——JSP过滤器的web.xml配置各节点说明

hadoop单节点的配置

hadoop namenode 节点无法启动

Hadoop-balancer执行原理

关于Jemter各节点参数介绍

tensorflow查看ckpt各节点名称

HDFS Balancer（HDFS重新平衡）

（3）hadoop单节点配置

HADOOP 增加子节点配置

今日推荐

周排行

(BIND最佳实践)Linux运维最佳实践

makefile ifeq之坑: 1. syntax error near unexpected token 2. *** missing separator. Stop.

easyui datagrid操作栏内置图片按钮

SQLyog连接MySQL时出现的2058错误解决方法

linux音频开发

hashcode方法简析

SpringBoot中使用Transaction注解遇到的坑

逆战-CSS中子元素在父元素中的4种水平垂直居中方法

Expression.Blend.4 Chapter 图片和视频的使用

springMVC返回void值

每日归档

更多

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)