项目需求,需要Oracle、Hive之间的数据同步,Kettle连接Hive,坑比较多,Mark下。
一、环境说明
我的大数据集群环境使用的Cloudera,CDH版本为5.14,其他为,
- kettle的版本是:8.2
- hadoop:2.6.0
- hive:1.1
二、Hive配置信息
1、到Cloudera manager界面,选择Hive,下载客户端配置,
2、解压配置文件
3、然后将解压的配置文件复制到kettle的安装目录下,我的路径是:D:\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh514
三、所需 jar 包
配置文件搞定后,启动报错,还缺两个hadoop的依赖包,hadoop-core.jar和hadoop-common.jar。
放上依赖jar后,重启,测试成功。