hadoop经典系列(二)hadoop常用命令初步

distcp 并行复制
相同版本的hadoop集群
hadoop distcp hdfs//namenode1/foo hdfs//namenode2/bar

不同版本的hadoop集群(hdfs版本),在写的一方执行
hadoop distcp hftp://namenode1:50070/foo hdfs://namenode2/bar

hadoop的归档
归档的标准命令:archive -archiveName NAME -p <parent path> <src>* <dest>
hadoop archive -archiveName archive.har -p / archive /output

递归查看
hadoop dfs -lsr har:///test/archive.har

查看块的信息
./hadoop fsck /
./hadoop fsck / -files -blocks

猜你喜欢

转载自phl.iteye.com/blog/1938063