最近,作者整理了一套Hadoop搭建方案。最后的镜像大小1.4G多,使用docker子网,容器重新启动不需要重新配置/etc/hosts文件。
配置过程中参考了如下博客,有些细节问题这些博客里面解释的更加详细。
ssh配置部分:
https://blog.csdn.net/weixin_42051109/article/details/82744993
wordcount部分:
https://blog.csdn.net/alexwym/article/details/82497582
虽然配置完了,但是有些地方并不完全懂,后续有机会还会做一些补充解释。
* 环境:Ubuntu16.04虚拟机
准备工作
下载解压jdk1.8文件夹
下载解压Hadoop2.8.5文件夹
docker pull centos7基础镜像
建mydocker文件夹
将jdk1.8文件夹和Hadoop文件夹移动到mydocker文件夹(这里为了简洁将Hadoop2.8.5文件夹重命名为Hadoop)
编辑Hadoop文件夹内的文件(避免创建镜像后要修改三遍)
首先进入Hadoop/etc/Hadoop文件夹后修改hadoop.env.sh
tianyou@ubuntu:~/mydocker/Hadoop/etc/Hadoop$ vim hadoop-env.sh
将JAVA_HOME修改为如下路径
export JAVA_HOME= /usr/local/jdk1.8
修改core-site.xml如下
tianyou@ubuntu:~/mydocker/hadoop/etc/hadoop$ vim core-site.xml
————————————————
版权声明:本文为CSDN博主「CSDN云计算」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/FL63Zv9Zou86950w/article/details/104681415