数据仓库 与SIG系统的理解
数据仓库
可以简单理解为 与事务性数据库相对于的另外一个概念 可以通过关系型数据库来用于保存大量的历史数据 用于在生产中分析数据 给用户提供一些 规律性的决策总结性依据 从而提高生产效率 ?
?
数据仓库从功能结构上来说最少要包括 数据获取(Data Acquisition) 数据存储(Data Storage) 数据查询(Data Access)关键部分 对应到SIG系统中 分布式 DAS 组件获取数据 ?ETL组件 以及 NOde组件用于数据存储 显然 UI报表查询组件对应查询。
?
存储与查询是数据仓库系统 最核心最关键的部分 Sig系统中 ETL ?NOde 组件 具有汇总 清理数据的功能。
?
元数据的概念 ?数据仓库内的数据结构以及 建立方法的数据
从用途上可以分为两类 客户元数据 (跟客户紧密相关的数据) 用户元数据(系统维护相关的数据 以及辅助客户相关的数据)
?
数据仓库 在范围上可以分为 企业级 数据仓库 和部门级数据仓库(SIG 系统更像是没有区分这些 ?部门级也就是数据集市)
数据集市 是数据仓库的一个子集 ?
两者的比较可以再下图中看出来(附件中)
?
一般被描述成星型结构或雪花结构有一个
事实表(如SIG系统里面的 流量原始入库表等) 以及对应多个维度表(例如SIG 系统里面的 存储周期)两个基本元素组成
详细数据
?? 简单的 数据集市中的 原始表中的数据(SIG系统中的 5分钟表 数据)
汇总数据
??根据存储周期汇总后的 天表 小时表 月表数据
??
?
?