7.5.1、Kettle__kettle的概述,kettle的工程存储方式,涉及方式,组成

kettle系列文章目录


作者:Loves_dccBigData


前言


提示:以下是本篇文章正文内容

1、概述

kettle是一款开源的ETL工具,纯Java编写,可以在windows,linux,Unix运行,绿色无需安装,数据抽取高效稳定

2、kettle工程存储方式

(1)以XML形式存储
(2)以资源库方式存储(数据库资源库和文件资源库)

3、kettle的两种设计

简述:

Transformation(转换):完成针对数据的基础转换 Job(作业):完成整个工作流的控制

区别:

(1)作业是步骤流,转换是数据流
(2)作业每一个步骤,必须等到前面的步骤跑完,后面步骤才会执行,而转换会一次性把所有控件全部启动(一个控件启动一个线程),然后数据流会从第一个控件开始,一条条记录的流向客户端
在这里插入图片描述

4、kettle的组成

1)Spoon.bat/Spoon.sh:是一个图形化的界面,可以用图形方式开发转换和作业,linux选择Spoon.sh,Windows选择Spoon.bat
2)Pan.bat/Pan.sh:利用pan可以用命令行形式调用Trans
3)Kitchen.bat/Kitchen.sh:利用Kitchen可以使用命令行调用Job
4)Carte.bat/Carte.sh:Catte是一个轻量级的Web容器,用于建立专用,远程ETL Server

猜你喜欢

转载自blog.csdn.net/nerer/article/details/120946719