代码之家  ›  专栏  ›  技术社区  ›  Jas Panesar

使用Java或.NET对ColdFusion的PDF进行光学字符识别。NET库?

  •  1
  • Jas Panesar  · 技术社区  · 16 年前

    有没有图书馆在这方面做得很好?我包括Java或。NET(Java优先)库,因为它们可以从CF调用。

    编辑:据我所知,使用CF将文本嵌入PDF中时,对PDF文件进行索引是有效的。我必须处理的PDF将文本扫描为图像。

    4 回复  |  直到 13 年前
        1
  •  1
  •   Peter Boughton    16 年前

    如果您有能力运行自己的软件(即专用/VPS),那么您可以使用 Tesseract OCR 具有 cfexecute

        2
  •  1
  •   robsymonds    16 年前
        3
  •  0
  •   Peter Boughton    16 年前

    Ray Camden有一个由八部分组成的系列 working with PDFs in ColdFusion 8 .

    Part 7

        4
  •  0
  •   Jas Panesar    16 年前

    http://www.stillnetstudios.com/2007/12/15/2d-barcodes-coldfusion/

    这可能会解决我需要提取编码信息的一些问题,但我仍然在寻找文本的主体。

    http://www.pixel-technology.com/freeware/tessnet2/ 如果我能原生地输入PDF而不是TIFF。. :)