Kettle (Pentaho数据集成 - PDI)
Kettle,也称为Pentaho数据集成(PDI),是一个流行的开源ETL(抽取、转换、加载)工具。它用于数据集成,允许用户图形化设计数据管道,从各种来源抽取数据,进行转换,并将其加载到不同的目标系统中。Kettle是Pentaho BI套件的一部分,以其用户友好的界面和灵活性而闻名。
核心功能特性
可视化ETL设计
通过直观的Spoon界面拖拽组件,零代码构建数据管道
多源数据支持
支持关系型数据库、NoSQL、Excel/CSV等30+数据源
强大转换能力
提供200+转换步骤,支持复杂数据操作
智能作业调度
可视化编排任务流,支持定时执行和错误处理
开源免费
Apache 2.0开源协议,无商业授权费用
企业级扩展
商业版提供集群部署、权限管理等高级功能
版本选择
社区版
- ✓ 完全免费开源
- ✓ 基础ETL功能
- ✓ 活跃社区支持
- ✓ 插件市场
企业版
- ★ 专业技术支持
- ★ 集群部署能力
- ★ 安全管理功能
- ★ 性能监控工具
PDI核心组件
Spoon
图形化设计工具,用于创建ETL转换和作业
Pan
命令行工具,用于执行转换
Kitchen
命令行工具,用于执行作业
Carte
轻量级Web服务器,支持远程执行和集群