代码之家  ›  专栏  ›  技术社区  ›  FloE

什么是数据仓库?

  •  21
  • FloE  · 技术社区  · 16 年前

    一位客户问我,“数据仓库”一词的真正含义是什么。

    我考虑了ETL、数据模型的细节、与NoSQL的区别、云、“普通”DBMS、MDM(主数据管理)等,但没能用几句话来描述这个术语(事实上,我做了一些谈话,让他没有照明。)

    如何用1-3句(或更多)来描述“数据仓库”?

    11 回复  |  直到 10 年前
        1
  •  21
  •   dzida    16 年前

    对于非技术人员来说,最好的描述是 “大量的数据存储在专门的计算机系统中。数据通常涉及到某个特定的领域,整个系统的设计是为了快速和优化一些特殊的任务。存储在数据仓库中的数据主要用于分析或决策过程。”

    不确定这是否足够:)在互联网上有很多关于这个主题的参考文献,但是如果有人问我一个快速的定义,我会使用类似于我上面写的东西。

        2
  •  6
  •   Mitch Wheat    16 年前

    wiki :

    数据仓库是一个 组织的电子存储 数据,旨在促进报告 分析 1 .

    专注于数据存储。然而 提取、转换和加载数据,以及 管理数据字典也很重要 被认为是 对数据仓库使用的参考 这是一个更广泛的背景。因此 情报工具,提取工具, 将数据转换并加载到 检索元数据。

        3
  •  6
  •   Jerry Coffin    16 年前

    主要目的是(通常)允许来自现有系统的数据之间的关联。例如,您可以比较您的销售人员花在客户X上的时间(存储在一个系统中)与客户X购买的时间(存储在第二个系统中)以及客户X对他们收到的东西的满意程度(当然,存储在第三个系统中)。

    从实际的角度来看,这往往意味着客户的想法介于定义不清和完全疯狂之间。成本和进度几乎不可能猜测,而可靠的估计显然是不可能的。实现他真正想要的几乎肯定是不可能的,而找出有用的东西将需要足够的时间和工作,你的第一步是让你所做的事情听起来足够有技术性,当他知道成本和/或日程安排时,他不会得心脏病。

        4
  •  5
  •   Irwin    13 年前

    哇,我在做研究。这是我遇到的一个非常好的答案:

    它来自 Data Warehouse 100 Success Secrets “理查德·马丁

        5
  •  4
  •   Serapth    16 年前

    数据仓库是一种尝试,旨在使不同的系统看起来是同质的,而不考虑底层技术或存储机制。

        6
  •  3
  •   ConcernedOfTunbridgeWells    16 年前

    数据仓库是一种数据库、数据加载和报告系统,旨在聚合来自多个来源的数据,并以易于提取和报告的方式呈现这些数据。从实践的角度来看,成功的数据仓库项目的好处是:

    • 统计和财务报告—数据仓库可以方便地处理聚合数据并从中获得有用的分析,特别是当您有65537行或更多行数据时。

    • 数据安全-数据表现良好,没有针对年轻玩家的陷阱。没有经验的用户可以使用临时报告系统,在报告中产生无效结果的风险很低,而且不会引起注意。

    • 透明性—业务部门可以看到并识别底层系统中数据的问题。数据仓库是推动数据质量工作的好工具。

        7
  •  3
  •   bochgoch    16 年前

    吻。。。

    数据仓库是与给定组织及其活动相关的数据存储库。这些数据将允许分析和报告组织在各种相关方面的表现,如时间、结构、活动流。这些维度可以通过相关层次结构进行组合和结果聚合。

        8
  •  1
  •   Marjan Venema    16 年前

    从实践的角度来看:企业变化,环境变化,昨天的重要问题是什么,可能不是今天,也可能不是明天。在处理CEO级别的问题时尤其如此。

    如果你不能预见问题会是什么,你唯一的选择就是提供快速回答任何问题的方法。这就是数据仓库试图或声称要做的。数据来自何处,来自多少个不同的系统,都无关紧要。

    许多数据仓库在“快速回答任何问题”方面都失败了,因为他们的技术要求您将可用的原始数据“从内到外”(制作立方体)以确保“快速”地完成。定义这些立方体限制了可以回答的问题的多样性。

        9
  •  1
  •   vidya123    10 年前

    数据仓库是为查询和业务分析而不是为事务处理而设计的关系数据库,它包含从事务数据派生的历史数据。业务分析师使用这些历史数据来详细了解业务。

    数据仓库应具有以下特征:

    1. 主题导向:

    1. 综合:

    1. 非挥发性:

    一旦数据进入数据仓库,就不应该更新数据。

    为了分析业务,分析师需要大量的数据。因此,数据仓库应该包含历史数据。

        10
  •  1
  •   Santhoopa Jayawardhana    6 年前

    数据仓库是一个信息的中央存储库,可以对其进行分析以做出更明智的决策。数据从事务系统、关系数据库和其他来源流入数据仓库,通常是以固定的节奏。业务分析师、数据科学家和决策者通过商业智能(BI)工具、SQL客户端和其他分析应用程序访问数据。

    enter image description here

        11
  •  0
  •   farhankhwaja    13 年前

    据我所知,数据仓库不过是一个用于查询和分析的关系数据库。它通常包含从事务数据派生的历史数据。

    根据William Inmon,数据仓库的定义是:

    数据仓库是一个面向主题的、集成的、非易失性的、时变的数据集合,用于支持管理层的决策。

    如果我们理性地思考,并能从中得到理解,那么上述定义是合乎逻辑和完善的 here

        12
  •  -4
  •   Matthew Frederick    13 年前

    简单来说。。。

    数据仓库是一种控制真实仓库中的项目的方法,它包含控制位置、库存、移动、报告、审计,以及任何关于“真实仓库”中“真实项目”的内容。

    我希望它更简单。

    推荐文章