代码之家  ›  专栏  ›  技术社区  ›  Niraj

创建数据仓库需要遵循什么设计

  •  0
  • Niraj  · 技术社区  · 10 年前

    我正在做一个创建数据仓库的项目。我一直在使用第三方工具创建OLAP多维数据集,但问题是它为每个OLAP多维数据集中创建了单独的暂存区,而我的大多数多维数据集共享相同的数据源。该公司决定创建一个数据仓库,然后多维数据集将从该仓库中获取数据。

    我将从不同的源提取数据,并将其存储在数据库(暂存区)中,然后将这些数据转换为维度和事实的适当表,并将它们存储在一个称为数据仓库的单独数据库中,然后我将通过从数据仓库中获取数据来创建单独的多维数据集。

    我在这里担心的是,我是否可以为暂存区和数据库仓库创建不同的数据库,尽管它们将位于同一服务器上?

    另外,对于我的数据集市,我需要将所有数据集市放到同一个仓库中,或者我可以将它们放到不同的数据库中,我想在这里了解逻辑和物理分离以及最佳实践。

    2 回复  |  直到 10 年前
        1
  •  1
  •   Edward Comeau    10 年前

    听起来,您已经从Bill Inmon的数据仓库解决方案中得到了类似Corporate Information Factory的规定。

    http://www.inmoncif.com/library/cif/

    将EDW视为单个数据仓库,将部门数据集市视为单个多维数据集。

    您可以在加载第一个数据仓库并将其用作集中数据时进行标准化(并执行大部分转换)。

    加载多维数据集时,您可以从几种显示数据以供加载的方法中进行选择。如您所述,转移到新的单个数据库,在中央数据仓库的顶部创建视图以从中读取数据,或者为每个多维数据集创建单独的转移区域。

    请记住,单独多维数据集的目的可能是将各个部门相互隔离,以实现各个部门的快速简明开发,而第一个中央数据仓库的目的可能在于将不同的数据调和成一个合意的数据集,然后再用于多个报告目的。

    与决定你的架构的人交谈,看看他们有什么想法或他们想解决的问题。

        2
  •  -1
  •   Deepesh Tiwari    10 年前

    用于设计数据仓库。

    1. 首先,我们应该知道数据仓库的实用性(意味着我们将从系统中获取什么类型的报告)

    2. 我们需要选择模式(STAR或SNOWFLAK)

    3. 我们需要创建数据仓库的维度。

    4. 我们需要创建一个事实表,在其中存储所有事务数据。