数据仓库的模型

数据仓库的模型

  • 星型模型(Star scheme):事实表在中心,周围围绕着连接单个维表,事实表中含有的数据量十分巨大,极少或没有冗余。星型模型基于一个特定的主题,体现了数据库对数据结构和组织的要求。由于结构简单,易于数据的操纵和理解,且具有良好的数据连接路径,在整个数据仓库生命周期中易于修改及增补。
    这里写图片描述

    星型模型是数据集市维度建模中推荐的建模方法。星型模型是以事实表为中心,所有的维度表直接连接在事实表上,像星星一样。星型模型的特点是数据组织直观,执行效率高。因为在数据集市的建设过程中,数据经过了预处理,比如按照维度进行了汇总,排序等等,数据量减少,执行的效率就比较高。
    从结构图可以看出其拥有如下特点:①维度表只和事实表有联系,各维度之间没有关联。②每个维表均是以主键存放在事实表中,而不在事实表中存放该维度具体信息。具体数据信息存在维度表其他列中。③维度表结构像星星围绕在事实表周围。

  • 雪花模型(Snow flake schema):是由星型模型变化而来,其中某些维度是规划化的(将引起冗余的字段用一个新表来表示),因而把数据进一步的分解到附加表中,结果模式图形形成类似于雪花的形状,其优点是能够便捷地组织层次结构数据。
    这里写图片描述

    雪花模型也是维度建模中的一种选择。雪花模型的维度表可以拥有其他维度表的,虽然这种模型相比星型模型更规范一些,但是由于这种模型不太容易理解,维护成本比较高,而且性能方面需要关联多层维表,性能也比星型模型要低。所以一般不是很常用。
    这种模式将星型模型中的维度拆分成更细维度,这样做使数据库结构更为清晰也更为规范化,但是所消耗的资源极大,所以实际生产环境中一般不采用这种模式。

本站公众号
   欢迎关注本站公众号,获取更多程序园信息
开发小院