CentOS 指令运行 kettle 实现数据迁移
时间:2023-08-20 14:07:00
CentOS 指令运行 kettle 实现数据迁移
- Kettle
-
- spoon.bat
- Windows使用步骤
-
- 转换
- 作业
- Linux使用步骤
-
- 配置环境
- 运行 Spoon 装换和操作
- 在Linux上运行kettle小案例
Kettle
spoon.bat
kettle 是纯 java 开发,开源 ETL工具,用于数据库间的数据迁移 。可以在 Linux、windows、unix 中间运行。图形界面和命令脚本可以二次开发。
Windows使用步骤
1.基于java因此需要安装开发jdk并配置JAVA_HOME环境变量(建议安装JDK1.8)
2.安装kettle 链接:https://pan.baidu.com/s/1x0gEjX3PtJl69IqOt5C1Bw 提取码:aqgy
3.下载mysql数据库驱动jar包,放入lib目录下 链接:https://pan.baidu.com/s/1TLIhQ6hlYajbHsBTaPch2Q 提取码:afgq
4.双击spoon.bat启动kettle
转换
1.左上角 文件->新建->转换
2.左上角 文件->保存->起名字
3.左侧菜单栏 主对象树->DB连接(右键->新建)
4.使用 核心对象->输入->表输入(拖到右工作区)
5.双击->获取数据->点击预览
6.核心对象->输出->表输出(拖到右工作区)
7.按住shift连接两个步骤
8.运行
9.在数据库中查看数据
作业
1.左上角 文件->新建->作业
2.左上角 文件->保存->起名字
3.按图拖动并按顺序连接
4.设置循环
5.设置执行转换
6.运行
Linux使用步骤
配置环境
1.安装 jdk 1.8
首先,确保系统安装 JDK 1.8 (其他版本建议更换 1.8) 可输入指令 java -version
查看 Java 版本
如果没有安装,可以使用 yum install java-1.8.0-openjdk
命令安装
2.下载 Kettle 软件并解压
这里用的是 pdi-ce-7.1 版本, 百度网盘链接如下:
https://pan.baidu.com/s/1eziGs6zFhTNYya1oBqoutw 密码: aaaa
3.启动服务
在 pdi-ce 目录下进入 data-integration 目录下, 执行 ./kitchen.sh 看看服务能否启动:
如图所示,缺少组件, 按要求输入命令: sudo apt-get install libwebkitgtk-1.0-0
安装依赖项.
运行 Spoon 装换和操作
1.将 Spoon 文件传至 CentOS 系统中
首先,有图形界面的计算机需要编写转换或作业, 并保存成**( *.ktr / *.kjb)**文件并传至CentOS 中.
2.用指令操作
进入到 data-integration 目录下:
运行转换文件 (*.ktr): ./pan.sh -file:文件地址
运行作业文件 (*.kjb): ./kitchen.sh -file:文件地址
在Linux上运行kettle小案例
kfc.ktr
功能简述
统一字段后,将三个不同数据库中的表更新并插入另一个数据库中。
my_kfc.kjb
功能简述
设置每隔一分钟执行一次kfc.ktr。
注意填写位置时,需要明确和kfc.ktr目录位置。
1.将 kfc.ktr
和 my_kfc.kjb
移动到 CentOS 的 /home 文件夹下
2.进入 data-integration 目录下, 执行 ./kitchen.sh -file:/home/my_kfc.kjb
3.运行成功后查看数据库, 每分钟发现变化,可自动更新.