时间 地区 指标的数据库如何设计好?
rt,时间一般就是年
地区 :省,市,县,分别是一张表的,即有省表 ,市表,县表
指标:很多,而且按时间统计的,比如牛奶产量,鸡蛋产量,牛存栏,猪肉...
指标可能不定期增加,时间也是每年更新,地区是固定的
原来的设计方案是:
table指标(指标id,指标名)
table地区(code,name)
110000 北京
... ...
table事实(地区id,指标id,指标value)
觉得事实表里有很多重复的,如果指标很多的话。
各位有什么建议,谢谢!
[解决办法]
1.在仓库里,指标应该是一个计算值。所有事实表是干净的,没有经任何加工处理过的数据。所以,你只要存数量就可以了,当然,也可以多个度量。
2.省表,市表,县表,建议将三个表合一,组成用层次表示的父子结构。
[解决办法]
建立你专门做一个针对DW的数据库。所有数据经过ETL后进入到该库。然后用这个DW库来建立数据仓库。