数据仓库中dimension,level,hierarchy的理解
dimension: 从几何学上理解,就是一个坐标。比如时间是很常见的维。
值得注意的是,一个维的确定,维里面的具体的值需要是原子的,不能再分的。
level: 坐标上当然有刻度。举例来说,时间维如果我们的刻度最小单位为天的话,那么dimension的值集合就是类似于(...,2005-01-01,2005-01-02,...)。
level就是对这些值集合分组的级别。 比如可以有月这个level,就是按月分组。年这个level就是按年分组。
hierarchy(层次)是指几个相关的,有父子关系的层级level的组合。举例来说,产品维,假设一家公司生产如下的产品:
21寸彩电
29寸彩电
30寸彩电
A型冰箱
B型冰箱
A型洗衣机
B型洗衣机
A手机
B手机
PC A
PC B
那么对产品维来说,从大到小有这样几个层级:
所有产品->产品大类->具体产品
所有产品这级别,只有一个值。
产品大类有: 彩电,冰箱,洗衣机,手机, PC
具体产品就是以上所有的详细型号的产品。
这里还可以在产品大类上面增加一个level:家电、数码产品,当然这个视需要而定。
所有产品->产品大类->具体产品
这就是一个hierarchy。说白了就是一个分类的方案。有几个不同的分类方案就有几个hierarchy。