请问如何使用数据仓库
有个新项目,需要使用数据仓库为基础,给某公司做一个决策系统,需要在原有系统中抽取,转换,加工,分析数据,挖掘有价值的信息.之前没接触过类似的项目,这两天查了很多资料,感觉都是在说概念上的问题.有没有人能从实际出发,简要的说明这个过程应该怎么做?需要用到哪些技术?
[解决办法]
找些专业论文或书籍看看,学习下SQL2005中的数据挖掘使用方法。
[解决办法]
看你们公司给这个项目成本费用有多少。
给你一种比较底成本的工具及技术.
1. 抽取通过开发一个C++程序,如果程序优化得好的话,抽取速度在2.5万条数据每秒
2. 抽取成文件后,转换加工一般大型项目采用informatic处理,如果不想买此类软件,则直接使用
awk+shell或者c++实现也可以
3. 然后是建立数据仓库,可以采用oracle和sybase。
前期模型一定要考虑周全,将数据从文件通过sqlloder 导入数据仓库。
通过存储过程生成报表.