如何入门数据仓库,请关注本贴。
大家好,
看了论坛里的帖子,很多网友对数据仓库如何入门表示困惑。我正好从事这方面的工作,给大家一些关键性的信息,帮助大家梳理一下对数据仓库的认识。
1.数据仓库的概念,你需要都几本书,打开你的视线。
Building the Data Warehouse-作者: W. H. Inmon
参考地址:http://book.douban.com/subject/2667055/
中文版:http://book.douban.com/subject/1881631/
从累计知识上来说,你最少需要读相关书籍一本以上。
2.实践数据仓库,可以肯定的说,你需要有一个数据库环境。安装开源的Mysql,Postgresql都是首选。Oracle,Ms Sql这些商业数据库变化太快,使用方式都是自家一套,你还需要付费购买版权,不推荐。
在数据库的基础之上,你需要掌握的地一套技能就是ETL。工具推荐Pentaho Kettle,JasperSoft Etl,Talend ETL这些开源的工具上。很多朋友都说资料难找,掌握起来不方便。我想提醒你,工具的使用是建立在你的知识结构上的。
实际一点,拿kettle来说,学习如何使用,在下载的包里就是范例。pentaho有WIKI站点提供控件定义,还有健全的用户论坛。当然是英文的,你总不能拿不懂英文当回事。不会就需要改进。
3.掌握OLAP实践,这里还是工具。有了数据之后需要有个好用的模型来查询,就是建立“Cube”(立方体),Pentaho Mondrian就可以做。这里就需要你的JAVA知识了。
4.写前端报表,还是工具,pentaho reporting,http://reporting.pentaho.com/,还是JAVA。你如果不想有限制,也可以自己写一个报表,能不能成看你功力。
[解决办法]
很好。
[解决办法]
好,太好
[解决办法]
领教了
[解决办法]
学习了
[解决办法]
膜拜,刚接触云计算那阵真晕,现在我在戴尔工作
[解决办法]
难度有些大啊
[解决办法]
学习了!
[解决办法]
恩,自己练手可以研究下开源的工具