安装前一定要阅读:
这篇文章我只介绍了如何安装sqoop,对于下面利用sqoop将mysql里面的数据复制到HDFS,涉及到mysql的安装和远程连接问题,请自行百度,或者参考我的这篇博客。
https://blog.csdn.net/qq_43437122/article/details/103551878
1.上传文件
需要上传sqoop的安装包和连接mysql的驱动:
本人比较良心,为了帮助更多的人,不在将文件上传到平台上赚取C币了:
sqoop下载(提取码:7cmh):https://pan.baidu.com/s/1DExhZuRfIIdGn7hVE9Pp4g
mysql驱动下载(提取码:6fzg):https://pan.baidu.com/s/1rvryi5vTYg_estvKoAuTeA
如图所示:
2.安装sqoop和配置sqoop环境变量
2.1解压安装包(安装目录自己指定,别忘了就行)
sudo tar -zxvf sqoop-1.4.4.bin__hadoop-2.0.4-alpha.tar.gz -C /itcast/
2.2重命名安装包
mv sqoop-1.4.4.bin__hadoop-2.0.4-alpha/ sqoop1.4.4
2.3配置环境变量
vim /etc/profile
将红色标注的内容新加入到你的配置文件中,当然对于老手肯定很简单啦。
配置过后一定要刷新配置文件:source /etc/profile
然后你可以在命令行输入sqoo然后tab键看是否能自动补全,以此验证配置文件是否正确。
3.移动驱动文件
将驱动文件移动到sqoop安装目录下的lib文件夹,如图:
mv ~/下载/mysql-connector-5.1.8.jar /itcast/sqoop1.4.4/lib/
4.验证sqoop
首先说明,我要将我的mysql里面xbox库下的sqoop01表的内容复制到HDFS上,命令如下:
sqoop import --connect jdbc:mysql://192.168.1.10:3306/xbox --username root --password 123456 --table sqoop01 --columns 'name, age'
执行过程如图:
这张图显示了任务的进度:
结果:
我只展示了一个文件的内容,和数据库那张图片红箭头标出来的数据一样。
到此你的sqoop搭建成功。