首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 开源软件 >

转载:开源ETL工具跟商业ETL工具比较(译文)

2012-06-27 
转载:开源ETL工具和商业ETL工具比较(译文)开源ETL工具和商业ETL工具比较(译文)http://hackfisher.info/blo

转载:开源ETL工具和商业ETL工具比较(译文)

开源ETL工具和商业ETL工具比较(译文)

http://hackfisher.info/blog/2011/07/open-source-etl-compare-commencial-etl-tool-translate/

?

因为我对开源ETL工具也不太了解,正好最近再做这方面的研究,发现了这篇文章概括的还蛮仔细,就翻译过来了,能对现有的开源ETL工具有个初步了解。因为文章好像是08年的,可能已经过时了,以为已经过去快3年了,世事发展变化很快。————————————————————————————开源ETL工具和商业ETL工具比较

作者:jonathanlevin译者:Yangtsefisher原文地址:http://www.jonathanlevin.co.uk/2008/03/open-source-etl-tools-vs-commerical-etl.html发表日期:2008年最近,公司要求我用一个开源ETL工具来代替商业的数据整合工具,Informatica?PowerCenter的案例。所以我尽我最大的努力,做了很多研究,并且假设我既没有用过开源工具,也没有用过商业工具。我找到了很多?Pentaho?Kettle?和?Talend之间比较的信息,这是我本来打算研究的两个开源工具。现在,我打算简短的比较一下它们的优劣。声明一下,这些比较是基于我在网上的研究,而非我使用这些工具的经验(事实上,我也没有用过)。

Pentaho?Kettle?vs?Talend

PentahoPentaho是一个商业开源的BI套件,有一个数据整合的产品叫做Kettle。它创新的采用了元驱动的方法,并且拥有一个很强和很好用的GUI。这个公司开始于2001年(2002左右Kettle被整合进去)。它有一个13,500注册用户的强大社区。它有一个独立的Java引擎来运行处理不同数据库和文件之间数据转换的作业和任务。它可以调度任务(需要一个像cron的调度器)。它可以运行部署在其他机器上“slave?servers”的远程任务。它拥有数据质量特征: 在它的GUI上,可以写自定义的SQL查询,JavaScript,和正则表达式。TalendTalend是一个开源的数据整合工具(不是BI套件)。它使用代码生成的方法。有一个GUI,但是在Eclipse?RC里面。它开始于2006年10月。它有一个比Pentaho小得多的社区,但是有两个金融公司支持。它生成可以在你服务器上运行的Java和Perl代码。它可以调度任务(需要一个像cron的调度器)。数据质量特征:界面上可以写自定义的SQL查询和Java。比较- (就我的理解)Pentaho比Talend更快(两倍也许)。Pentaho的GUI比Talend的GUI更容易,所以可以花更少的时间学习。印象Pentaho的GUI更易用一些。Talend更像是给那些已经用Java写程序的人,希望可以通过一个工具自动给他们生成代码,从而节省很多时间。假设Pentaho?晋级下一轮...

Pentaho?Kettle?vs?Informatica

InformaticaInformatica是一个非常优秀的数据整合商业套件。成立于1993年。它是分享市场的领导者(Gartner?数据来源)。它有2600多个客户。其中有财富100强,道琼斯上市公司和政府部门。公司的核心业务就是数据整合。它用一个非常大的包,整合进企业的系统,清洗他们的数据,并且可以连接到相当多当前的和传统的系统。它非常贵,需要对你的雇员进行培训后才能使用,甚至有时需要请咨询(听说Informatica的咨询顾问薪资很高)。它非常的快,并且可以适应大规模的系统。它有一个采用了ELT方法的"下推优化",使用数据库来做转化操作,比如Oracle仓库构建。比较Pentaho的Javascipt在写数据整合任务的时候非常强大。Informatica有很多的企业级特性,比如数据库之间的负载均衡。Pentaho的界面相较于Informatica来说需要的培训要少很多。Penatho不需要像Informatica那样大的前期投入。Informatica比Pentaho更快。Informatica有下推优化,但是如果对Pentaho做一些调整,并且有更多对数据库的了解,你可以改进Pentaho的速度。你可以在许多不同的服务器上部署Pentaho(只要你愿意,免费的),把它当作一个个集群。Informatic比Pentaho有好的多的监控工具。印象Infomatica真的是一个非常好的企业级ETL套件,但是非常大且昂贵。如果你的系统足够小,我更愿意尝试Pentaho,并且有很多大公司使用Pentaho的案例(一个机场,一个医院)。结论我觉得matt?casters有一句话说的好:开源软件的潮流正在慢慢冲走专有软件的空间。?如果你想补充(或更正)我在这里写的内容,就尽管做吧,因为我自己仍然在试图理解这些产品。你的观点是有价值的。?谢谢阅读。?

Published: July072011

热点排行