Kettle 连接 Hive 采集和灌入数据,Cloudera CDH514版本

项目需求,需要Oracle、Hive之间的数据同步,Kettle连接Hive,坑比较多,Mark下。

一、环境说明

我的大数据集群环境使用的Cloudera,CDH版本为5.14,其他为,

  • kettle的版本是:8.2
  • hadoop:2.6.0
  • hive:1.1

二、Hive配置信息

1、到Cloudera manager界面,选择Hive,下载客户端配置

2、解压配置文件

3、然后将解压的配置文件复制到kettle的安装目录下,我的路径是:D:\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh514

三、所需 jar 包

配置文件搞定后,启动报错,还缺两个hadoop的依赖包,hadoop-core.jar和hadoop-common.jar。

放上依赖jar后,重启,测试成功。

发布了125 篇原创文章 · 获赞 116 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/shipfei_csdn/article/details/103925063