Kettle是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定 1、以XML形式存储 1)官网地址 2)下载地址 在实际企业开发中,都是在想要看懂这本书,需要先把自己实力巩固上去,所以我们来学习一下Kettle吧QAQ👇👇👇
(图片来源于网络,侵删)
一、Kettle概述
【1】什么是Kettle?
【2】Kettle核心知识
1)Kettle工程存储方式
2、以资源库方式存储(数据库资源库和文件资源库)2)Kettle的两种设计
3)Kettle的组成
4)Kettle特点
二、Kettle安装部署
【1】Kettle安装地址
https://community.hitachivantara.com/docs/DOC-1009855
https://sourceforge.net/projects/pentaho/files/Data%20Integration/
【2】Windows下安装使用
1) 概述
本地环境
下进行Kettle的Job
和Transformation
开发的,可以在本地运行,也可以连接远程机器运行2)安装
Spoon.bat
,启动图形化界面工具,就可以直接使用了(第一次启动可能有点慢,属于正常现象)
三、Kettle入门案例
案例一
:把MySQL中stu1的数据按id
同步到stu2,stu2有相同id则更新数据(1) 将MySQL驱动Jar包放到Kettle的lib目录下,然后重启Kettle
(2) 在mysql中创建两张表stu1、stu2
create database kettle; use kettle; create table stu1(id int,name varchar(20),age int); create table stu2(id int,name varchar(20));
(3) 往两张表中插入一些数据
insert into stu1 values(1001,'zhangsan',20),(1002,'lisi',18), (1003,'wangwu',23); insert into stu2 values(1001,'wukong');
原始数据如下👇
最终效果如下👇
(4) 实战流程如下
查看MySQL数据库,效果和我们的需求一致,bingo!!!
案例二
:使用Job作业方式调度转换操作,并使用SQL插入数据到stu2(1) 使用案例1的表,先清空数据
truncate table stu1 truncate table stu2
(2) 往两张表中插入一些数据
insert into stu1 values(1001,'zhangsan',20),(1002,'lisi',18), (1003,'wangwu',23); insert into stu2 values(1001,'wukong');
(3) 实战流程如下
然后执行和之前一样保存,执行,效果如下👇
查看MySQL中的表数据👇
可以看到不仅stu1的数据更新到了stu2中,并且我们自定义的SQL插入操作的数据也存在,再次bingo!!!
案例三
:把HDFS中的数据插入到HBase中的表中
结果查看:如下图可以发现过滤出了 sal 大于 1000的👇
都看到这里了,评论一下吧!!!
点击查看👇
【Kettle】Kettle入门解析(二)
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox网页视频下载器 下载地址: ImovieBox网页视频下载器-最新版本下载
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算