Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案
本书主要介绍如何使用开源ETL工具来完成数据整合工作。本书介绍的PDI(Kettle)是一种开源的 ETL 解决方案,书
商家名称 |
信用等级 |
购买信息 |
订购本书 |
|
|
Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案 |
|
|
|
Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案 |
|
本书主要介绍如何使用开源ETL工具来完成数据整合工作。
本书介绍的PDI(Kettle)是一种开源的 ETL 解决方案,书中介绍了如何使用PDI来实现数据的剖析、清洗、校验、抽取、转换、加载等各类常见的ETL类工作。
除了ODS/DW类比较大型的应用外,Kettle 实际还可以为中小企业提供灵活的数据抽取和数据处理的功能。Kettle除了支持各种关系型数据库、HBase、MongoDB这样的NoSQL数据源外,它还支持Excel、Access这类小型的数据源。并且通过插件扩展,Kettle 可以支持各类数据源。本书详细介绍了Kettle可以处理的数据源,而且详细介绍了如何使用Kettle
抽取增量数据。
Kettle 的数据处理功能也很强大,除了选择、过滤、分组、连接、排序这些常用的功能外,Kettle 里的Java表达式、正则表达式、Java脚本、Java类等功能都非常灵活而强大,都非常适合于各种数据处理功能。本书也使用了一些篇幅介绍Kettle这些灵活的数据处理功能。
本书后面章节介绍了如何在 Kettle 上开发插件,如何使用Kettle处理实时数据流,以及如何在Amazon AWS上运行Kettle 等一些高级主题。
除了介绍PDI(Kettle)工具的使用和功能,本书还结合Kimball博士的数据仓库和ETL子系统的理论,从实践的角度介绍数据仓库的模型设计、数据仓库的构建方法,以及如何使用 PDI实现Kimball博士提出的34种ETL子系统。
网友对Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案的评论
这本书有开发者加入编写,写的很详细,新手可以将其当成手册使用,会用的也可以用来提升自己,完善的学习这个工具。
kettle这个工具也挺好的,适合想学习ETL的入门,学好了kettle,再去使用datastage也只需要熟悉一下界面就可以用了。
正版没问题,书的内容很好,解决了我们的问题
感觉一般,其它不想说什么。
没仔细看,也许商用产品更好
因为工作中用的到,网上资料又少,故买来看一下。
介绍比较全面、详细,打开了更多的工作思路,比较不错。
不适合初学者,但是很新的资料,
没看完,大致看了下,比较齐全
不大适合自己,实操的太多!本想买那种理论性较强的!
从毕业进公司到现在五个年头,一直致力于研究公司每个项目中的ETL方案,现在是使用kettle的第四个年头,感觉很棒。前年就听说过这本书的E文版,无奈自己E文非常糟糕,使用google翻译过几个小章节就放弃了,今天出来汉化版本,不知是不是原汁原味的内容,不过还是听开心的,终于可以读到全文。最后多谢作者,更要感谢Matt Casters!
PS:站在巨人的肩膀上更容易解决问题了,哈哈!
很好的书,不过还没有看完
喜欢Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案请与您的朋友分享,由于版权原因,读书人网不提供图书下载服务