首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 数据库 > 数据库开发 >

数据仓库数据模型之:极限储存-历史拉链表

2012-09-06 
数据仓库数据模型之:极限存储--历史拉链表在数据仓库的数据模型设计过程中,经常会遇到这样的需求:1. 数据

数据仓库数据模型之:极限存储--历史拉链表

在数据仓库的数据模型设计过程中,经常会遇到这样的需求:


1. 数据量比较大;
2. 表中的部分字段会被update,如用户的地址,产品的描述信息,订单的状态等等;
3. 需要查看某一个时间点或者时间段的历史快照信息,比如,查看某一个订单在历史某一个时间点的状态,
?? 比如,查看某一个用户在过去某一段时间内,更新过几次等等;
4. 变化的比例和频率不是很大,比如,总共有1000万的会员,每天新增和发生变化的有10万左右;
5. 如果对这边表每天都保留一份全量,那么每次全量中会保存很多不变的信息,对存储是极大的浪费;


拉链历史表,既能满足反应数据的历史状态,又可以最大程度的节省存储;

举个简单例子,比如有一张订单表,6月20号有3条记录:

创建订单

?

?

可以看出,这样的历史拉链表,既能满足对历史数据的需求,又能很大程度的节省存储资源;

?

关于这种历史拉链表的etl刷新策略和方法,下次再谈吧。。。

?

?

热点排行