我对数据仓库的感觉
我不知道该让这篇文章叫什么名。。。感觉写得有点乱。就暂叫:我对数据仓库的感觉 吧。
也许写得有不对的地方,请多包函。
对于数据仓库,我很早就看了一些相关的书,但由于客户一直没有相关的需求,所以仅仅知道MS有这么一个东西,但具体的东西是什么样的,我并不知道。
后来,看了杨大川的一个关于MSOLAP2000的录像,感到MSAS的功能非常的强大。看他演示了经典的数据挖掘--决策树,我心里就想,原来,数据的真正的意义在这里,后来他再
用普科(ProClarity)来演示分解树的时候,我觉得MSAS真是帅呆了。心里感觉,BI无所不能。未来,尤其是商业市场的未来,高端部分非数据仓库莫属。
就这样,一个演示的录像,让我走上了数据仓库之路。人的改变就是这样的偶然。
就这样,我决心要在这条路上走,无论多困难,我都要走。
买了十几本关于OLAP,NDX 的书,放在电脑包里,空闲时看看,上班坐公交车的路上看看,下班的路上看看。回家空闲时也看看。我并没有急于去掌握这门技术,我觉得,只要点
点滴滴,细水长流。我相信,再大的桶,也会有滴满的一天。
当我觉得书看得差不多了,于是,自己假想了一个简单的商业方案。用这个假想的方案去做一次实实际际的操作。呵呵,很顺利,这个假想的方案并不困难。很顺利地完了了。
水,终于滴到能看到的那一天了。当时我在某学会上班,里面,最充足的资源就是各种的统计数据,我选了一个最完整,最连续 的一个库---某某库。作为我第一个MSAS项目。
确定该项目为三个页面:第一个是普通的浏览,第二个页面是分解树,第三个页面是KPI。
功能或需求定位了,动手吧。。。。
重新做一个适适合数据仓库的库---就是反规格化的库。重新建立相关的可索引的视图,将原来的数据倒进去。建立仓库,写一个针对MSAS的类,写一个WEB的分解树的控件,
写了一个WEB展示的控件。最后,一个多月后,这个仓库出来了。我觉得很顺利。其间最大的收获是什么?写了关于MSAS的类,和OLAP的网络控件,让我知道MSAS返回的CELLSET是
什么东西,也让我的MDX更熟练了。 :)
早两三周前,我辞去了某学会的职务,变成了无业者。呵呵,我并没有急着找工作,觉得自己应该考虑一下自己的未来,我的未来在哪里?哪里是出路?
现在,已很少灵光一闪的思维了,该闪的事,几年前就闪过了。。。我觉得应该好好地沉淀一下,整理一下。在众多的技术面前,哪里有出路?我决定---还是BI。
不错,还是它,没人有什么东西比它对我更有吸引力的了,也没有什么比它更让我着迷的了。
但我知道,我只是刚开始,路,还是很的。
思考一下中国目前的BI现状,是什么现状?
企业对BI渴望,但对BI的价值评估严重不足,企业,一个用**3000,管*婆,管理的小工厂,用**CRM管理的客户,用某某*蝶,**MRP,**erp管理的大型企业。他到底需要BI的什么
?BI的哪部分?我看过一些企业的BI,充其量,就是一个报表。难道,在中国的企业,BI=报表 ?这就是需求?
/***********
插一个是外话:
如果BI仅仅等于多维的报表,我上几个月曾在CSDN里与人讨论过一个问题:用SQL模拟MDX的多维报表。后来,我下定决心,开发一个这样的WEB网格工具。一周的时间,我做出来的
。就是用SQLSERVER模拟的MDX WEB报表展示。仅仅从外表看,你还真分不出这是数据库。
其实,我开发这个报表的目的也是生产的需要,因为客户就是要这个报表就够了。多了反而部署困难。而开发的直接灵感或者说思路,则是原原版版的仓库的思路.
***********/
我突然想到,能不能将仓库与一些其它的工具配合起来,也许,BI会显得更完整。也会更容易.
我想到了MATLAB这个数学工具,MATLAB里有经典的工具箱,很多经典的算法,一些在其它编程语言很难做到的地方,它能轻易地做到,比如说,矩阵的运算,各种积分,多重积分
,各种微分,各种插值,各种的仿真工程,各种的规划求解。更重要的,它的数据可视化,绝对是无敌的数据可视化,杀伤力太大了。而它比其它任何一门计算机语言更容易懂。
我心里的未来之路就是:数据仓库与MATALB的结合。
[解决办法]
学习,应该是应用SQL语句比较多吧?
[解决办法]
谢谢分享。
[解决办法]
基本赞同你的观点,初上CSDN,就是学习DELPHI感觉交流的人少,后来,学习各种数据库
也是这样
[解决办法]
照你的观点,仓库专用性强,通用性不强?
[解决办法]
感觉在数据库层面是一样的,用SQL语句处理、生成相关数据,表达方式是具体的吧?
[解决办法]
.
[解决办法]
谢谢分享
[解决办法]
[解决办法]
楼主的观点有独到之处,13楼的兄弟的论点我也非常赞同,我有强烈的同感!
[解决办法]
看完之后,感觉楼主对数据仓库的理解和看法还是有些片面,可能楼主是从事或曾经从事过诸如ssas,mdx web和matlab相关的工作或涉及过相关的项目吧!
matlab是一个很强的数据工具,在BI里,如果能应用到数据分析上去,可能会更好地发挥它的作用,但纵观整体BI行业,真正能把数据分析和数据挖掘做到极至的,在国内还几乎没有!
楼主研究的是数据仓库的方向之一,所以才有了此番见解。就像楼主说的,这可能仅仅是他“对数据仓库的感觉”吧!其实基于数据仓库基础之上的,还有很多可以研究!
我个人是做BI项目的,对这一方面,也有着自己的一些见解!对于现阶段国内的BI,我真的有一丝担忧,就像13楼的兄弟所言,那些大企业(移动、联通、电信、银行、邮政等,当然也有比这些更大的,只是我没发现)对BI的概念说来说去其核心就是报表,在分析和挖掘这个层面上,鲜有真正的成功实施案例!
啤酒和尿布的故事已经被说烂了,但那只是国外BI领先行业们的经典之作。而在现阶段的中国,我们谁又能真正做出一个像这样能推断出“啤酒和尿布摆在一起可以提高销售量”这样的预测呢(当然还是有,只是都比较浅,不够经典)!
这是一种可悲,但不知道这应该是那些正在使用BI的企业们的悲哀(对BI的理解和认同太片面,太匮乏),还是BI人的悲哀(没有做出真正像样的能让客户真正满意的BI解决方案来)。
希望所有BI人,都能积极努力推进BI事业在中国的发展~~
[解决办法]
分析的有道理。
好多版块活跃不起来,就是类似这个原因。
[解决办法]
数据仓库是一个过程,而不是一个产品或简单的一个项目.
[解决办法]
怎么最近一段时间,越来越多地听到数据仓库这个名词,和数据库有区别吗?
[解决办法]
很赞同楼主在19楼的分析和见解!
的确,在中国,每件事似乎都有它的潜规则,所以我也比较赞同“BI不仅仅是技术”这一观点!
去各地做项目实施,免不了要喝酒,可本人却偏偏极为反感这种任何事都用酒来解决的社交方式和风气,那些做销售的同事们,就更不用多说了,想拿单子?可能看中的不是你的技术,而是你的酒量!!也许,这就是楼主所谓的“攻人”策略吧!!
中国人,钻研的不是如何把技术做深,而是如何把客户喝倒,喝满意~~
可怜的国度~~
[解决办法]