代码之家  ›  专栏  ›  技术社区  ›  Faiz

Informatica中的PDF数据源

  •  1
  • Faiz  · 技术社区  · 16 年前

    Informatica如何处理PDF等非结构化数据源?如果表格报告存储为PDF格式,我们可以将其作为表格数据(如.NET中的数据表)从PDF中读取吗?

    3 回复  |  直到 10 年前
        1
  •  2
  •   Marek Grzenkowicz    12 年前

    Informatica PowerCenter非结构化数据选项

    有趣的是,你提到这一点,我曾经为一家发明了基础技术的初创公司工作,直到收购Informatica。

        2
  •  0
  •   Stijn Sanders    16 年前

    PDF实际上在内部是非常结构化的。较新修订的PDF规范可能提供了一种保存数据以备外部处理的方法,但是PDF文档的主要目标是描述要打印的文档,因此各种环境和设备都可以打印文档,其结果尽可能类似。

    如果除了打印文本和行以形成表格之外,还提供了任何额外数据,这在很大程度上取决于PDF的创建者。

        3
  •  0
  •   Vishal    13 年前

    您必须使用Informatica B2B数据交换产品来处理非结构化数据。此产品提供处理各种非结构化数据的功能,不仅包括PDF,还包括Word、Excel、Star Office、AFP、PostScript、PCL和HTML。您必须使用Informatica B2B数据转换。

    http://www.informatica.com/us/products/b2b-data-exchange/b2b-data-transformation/