Hadoop的运行模式
单机模式是Hadoop的默认模式,在该模式下无需任何守护进程,所有程序都在单个JVM上运行,该模式主要用于开发和调试mapreduce的应用逻辑;
伪分布式模式下,Hadoop守护进程运行在一台机器上,模拟一个小规模的集群。该模式在单机模式的基础上增加了代码调试的功能,允许你检查NameNode,DataNode,Jobtracker,Tasktracker等模拟节点的运行情况;
单机模式和伪分布式模式均用于开发和调试的目的,真实Hadoop集群的运行采用的是完全分布式模式
单机模式安装步骤
一个干净的linux基础环境(重要,这个环境如果有问题后续就全是问题了)
为了方便大家我已经安装好了一个,大家只需下载导入到vm里即可使用。
下载地址:关注公众号【测试帮日记】对话框里回复“linux”或者加入QQ群522720170。
链接:https://pan.baidu.com/s/1qXRjaK8 密码:xjfk
关闭防火墙(适用于centos7,低版本不适用)
分别执行如下两条命令:
systemctl stop firewalld.service
systemctl disable firewalld.service
修改host name
vi /etc/hosts
然后把自己虚机的名字追加到两行的末尾,如果用的是我们提供的虚机,名字就是linux,追加之后的效果如图