代码之家  ›  专栏  ›  技术社区  ›  S.Lott

数据集市与报表多维数据集有什么区别?

  •  17
  • S.Lott  · 技术社区  · 16 年前

    这些术语到处都有,我不知道清晰的定义。我很确定我知道什么是数据集市。我还用Business Objects和Cognos等工具创建了报表多维数据集。

    我也有人告诉我,一个数据集市不仅仅是一个立方体的集合。

    我也有人告诉我,数据集市是一个报告多维数据集,仅此而已。

    你理解的区别是什么?

    8 回复  |  直到 6 年前
        1
  •  28
  •   Raffael    6 年前

    Cube 可以(并且可以说应该)表示一些非常具体的东西-通过 OLAP server MS Analysis Services 或Oracle(Nee Hyperion) Essbase . 然而,它也得到了更宽松的使用。这种类型的OLAP多维数据集使用支持多维数据集的查询工具,该工具对标准关系数据库使用不同的API。通常,OLAP服务器维护自己优化的数据结构(称为 MOLAP ,尽管它们可以作为关系数据源(称为 ROLAP )或在各种混合模式下(称为 HOLAP )

    我尝试具体化,并专门使用“cube”来引用OLAP服务器(如SSAS)上的cube。

    Business Objects 通过一个或多个源(可能是关系数据库、OLAP多维数据集或平面文件)查询数据并创建一个名为 MicroCube 它用来支持交互式切片和骰子活动。Analysis Services和MSQuery可以 cube (.cub) file 它可以被AS客户端软件或Excel打开,并以类似的方式进行切片和切块。IIRC业务对象的最新版本也可以打开.cub文件。

    为了学究,我认为Business Objects位于真正的OLAP系统(如ProClarity)和即席报告工具(如 Report Builder , Oracle Discoverer Brio . 到查询面板的往返行程使得它作为一个纯粹的思想流OLAP工具有点笨拙,但它确实提供了传统报表所不具备的交互性水平。我认为业务对象的最佳位置在于两个位置:由不一定熟悉SQL的员工进行的即席报告,以及在内部提供的计划报表。允许某些向下钻取到数据的活动格式。

    'Data Mart' 也是一个相当松散使用的术语,可以表示任何面向数据仓库系统的数据访问介质。定义可能包括或不包括报告工具和元数据层、报告层表或其他项,如多维数据集或其他分析系统。

    我倾向于认为数据集市是从中完成报告的数据库,特别是如果它是整个数据仓库体系结构中易于定义的子系统。但是,将其视为面向用户的报告层是非常合理的,特别是当有一些特殊的报告工具(如业务对象或OLAP系统)允许最终用户直接获取数据时。

        2
  •  9
  •   J.Biard    16 年前

    术语“数据集市”变得有些模棱两可,但它传统上与组织信息系统中面向主题的子集相关联。数据集市并没有明确表示存在像OLAP这样的多维技术,数据集市也没有明确表示存在汇总的数字数据。

    另一方面,多维数据集往往意味着数据是使用多维命名法(通常是一种OLAP技术)呈现的,并且数据通常被概括为多个层次结构的交叉点。(即家庭净值与个人净值以及两者之间的一切)一般来说,cube__cube_157;意味着非常具体的内容,而__data mart_157_往往更为一般。

    我想在OOP语言中,你可以准确地说数据集市有一个立方体,一个关系数据库,一个漂亮的报告接口,等等,但如果说其中任何一个单独的数据集市是数据集市,那就不太正确了。术语“数据集市”更具包容性。

        3
  •  4
  •   connectHeavenAndEarth    12 年前

    顾名思义,多维数据集是一个结构化的多维数据集(通常是三个维度,每个维度代表一个多维数据集的三个面)。数据集市本身只是一个容器,而不是一个结构,尽管它在维度和事实中包含扁平组织的数据集(如表)。

    多维数据集的结构使得沿着多维数据集的各个维度可视化或概念化数据变得容易。因此,大多数业务分析师或开发人员发现查询和与多维数据集交互很容易。

    由于数据集市只是一个包含大量表的容器;用户在查询和分析数据之前首先需要概念化和理解维度结构。

        4
  •  3
  •   dkretz    16 年前

    传统上,数据集市指的是静态数据,通常是面向日期/时间的,分析师用于统计、预算、性能和销售报告以及其他计划活动。

    多维数据集是一个OLAP数据库,它非常详尽地将OLTP数据转换为静态的、面向日期/时间的模式,该模式使用的查询语言不是SQL,而是专门为回答数据集市类型的问题而构建的。它使用度量值、维度、星型模式等术语,而不是表、列和行。最熟悉的类比可能是电子表格中的透视表。

        5
  •  3
  •   Mathew nguyen    13 年前

    数据集市是特定业务流程的数据集合。如何存储数据与此无关。与具有行和列的表不同,多维数据集以一种特殊的方式存储数据,即多维数据集。OLAP数据库中的多维数据集类似于传统数据库的表。数据集市可以有表或多维数据集。多维数据集使分析更快,因为它提前计算聚合。

        6
  •  3
  •   Jayron Soares    11 年前

    记得:

    数据仓库 是从遗留和事务数据库系统中获取数据并将其转换为用户友好格式的有组织信息的过程,以鼓励数据分析并支持基于事实的业务决策。

    数据仓库 是一个提取、清洁、符合和交付 将源数据存入维度数据存储,然后支持和实现 用于决策的查询和分析。

    KimBurl一直坚持将数据集市定义为基于原子数据基础的整个组织的过程导向子集,而这仅仅取决于数据测量事件的物理,而不是取决于预期用户的问题。

    • 数据集市基于数据源,而不是部门的数据视图。
    • 数据集市包含支持向下钻取到最低级别所需的所有原子细节。
    • 数据集市可以集中控制或分散。

    正确的定义

    • 基于过程
    • 原子数据基金会
    • 数据测量

    错误的定义

    • 基于部门
    • 仅聚合数据
    • 基于用户问题
        7
  •  1
  •   Brian Knoblauch    16 年前

    对我来说,数据集市只是以相对平坦、不可用的格式转储数据的地方。

    Cube正在获取数据并使其起舞。

        8
  •  1
  •   wnSarah-Marie Nothling    13 年前

    我同意马修的观点。我们倾向于将术语“数据集市”用于存储EnterPrize中不同应用程序之间使用的通用数据和映射的任何数据源。我们不在数据集市中存储可测量的数据,所以我将数据集市视为多维数据集的多个数据源之一。然而,这就是 我们 去做吧。我确信没有什么能阻止您在数据集市中存储可测量的数据。