代码之家  ›  专栏  ›  技术社区  ›  Spredzy

这是一个关于BI工作流的正确想法吗?

  •  2
  • Spredzy  · 技术社区  · 14 年前

    我刚接触商业智能。

    我刚被一家公司雇佣来完成他们的网络解决方案,实现了一个BI模块。在阅读了很多文章之后,我想我可以了解到一个BI流程是什么样子的,您会发现附上我关于一个BI流程的想法。

    您能告诉我这是否是所有工作流程的正确愿景吗?如果没有,请纠正我。另一个问题是,我在模式中看不到数据挖掘的位置,如果需要,我应该在哪里使用它?

    谢谢, alt text

    1 回复  |  直到 14 年前
        1
  •  7
  •   Registered User    14 年前

    以下是您可能需要考虑的几点:

    1. 演示层是Excel或Web服务,而不是其他内容,这是正确的吗?如果您想要部署一个Web报告平台,比如SSR、Cognos、Business Objects、Microstrategy等,该怎么办?这些平台通常不使用Web服务直接访问数据。

    2. 可能需要将其他数据输出到平面文件和下游数据库。数据可能基于OLAP多维数据集或原始源数据。因此,您可能希望将这些作为目的地包括在主数据仓库级别和OLAP级别。

    3. 如果您实现了一个Web表示层,它可能不仅在一个OLAP多维数据集上。很可能您会收到一个报告不包含在OLAP多维数据集中的数据的请求,而仅仅为了支持几个报告而添加它可能不值得。如果是这样,那么您可能需要注意的是,主数据仓库可能是Web报告平台的源——而不仅仅是OLAP。

    4. 数据集市通常不包含聚合数据——它们通常包含细节级别的数据。OLAP多维数据集对详细数据执行聚合,但基础数据集市本身包含事务级事实。

    5. 您可以拥有由ETL进程导入的其他数据源,如Web服务。您可能还想强调存在多个数据库和平面文件,正如您强调的那样,可能存在多个数据集市和OLAP多维数据集。

    6. 您不必为OLAP多维数据集需要单独的数据集市。如果您正在构建一个中央数据仓库,则可以创建一个中央OLAP多维数据集,并基于多维数据集安全角色限制对数据维度和切片的访问。

    7. 您可能希望指出在加载数据仓库之前需要加载临时数据库。也许情况并非如此,但通常我建议使用单独的临时数据库,以便在合并到数据仓库之前有一个加载位置。有些ETL进程可以直接进入数据仓库,因为它们可以在进入的过程中合并,但在很多情况下,在将数据合并到最终目的地之前,在临时数据库中加载数据可能是有意义的。这也意味着ETL/存储过程在图中可能应该是它自己的实体,因为它是一种移动数据的方法,而不是目的地或对象。如果您查看图表,那么您的所有实体都是实际的对象,而不是像MDX这样的进程。

    8. 您可能希望指示数据是通过ETL进程加载到数据集市中的。ETL不仅仅是装载数据仓库——而是在任何阶段移动数据。即使处理多维数据集也需要ETL过程。

    9. 您的OLAP服务器不一定要在另一个物理服务器上——它可能是数据库服务器上的一个服务。这取决于您是通过扩大规模来解决性能问题,还是因为地理性能问题而打算将多维数据集发布到多个OLAP服务器。