代码之家  ›  专栏  ›  技术社区  ›  Albert

数学公式的OCR库

ocr
  •  41
  • Albert  · 技术社区  · 15 年前

    我需要一个开放的OCR库,能够扫描复杂的打印数学公式(例如,一些公式是通过乳胶生成的)。我想得到一些类似乳胶的输出(或者只是一些类似AST的数据)。

    已经有这样的东西了吗?或者当前的OCR技术仅仅能够解析面向行的文本?

    (注意,我也张贴了 this question on Metaoptimize 因为有些人可能有额外的知识。)

    Openai还将问题描述为 im2latex .

    9 回复  |  直到 7 年前
        1
  •  15
  •   Slothworks    7 年前

    SSEAT是一个用C++编写的用于识别手写数学表达式的开源系统。Seshat是政治大学(Universitat Polit_¨cnica de Val_¨NCIA)的PRHLT研究中心的博士论文的一部分。

    在线演示: http://cat.prhlt.upv.es/mer/

    来源: https://github.com/falvaro/seshat

    Seshat是一个用于识别手写数学表达式的开源系统。给定一个以笔画序列表示的示例,解析器能够将其转换为乳胶或其他格式,如inkml或mathml。

        2
  •  6
  •   jjc    14 年前

    我只知道一个叫Inftyreader。这不是免费的软件(似乎钱流向了非盈利组织IIRC)。

    http://www.sciaccess.net/en/InftyReader/

    我不知道为什么PDF不能在乳胶中包含元数据?就像:把乳胶方程式放进去!这很难吗?(我对PDF语法一无所知,但我想可以做到)。

    乳胶句法是数学符号的一个久经考验的真正标准。生产MathML和其他东西的人不考虑这一点,这看起来非常愚蠢。inftyreader生成MathML或LaTex语法。

    如果我想要HTML(纯),那么就使用TTH来读取乳胶语法。只是工作。

    ABBYY FineReader(一个伟大的OCR程序)声称你可以训练数学软件,但这是一个非常愚蠢的人(谁有时间?)

    Unicode有很多数学符号。今天的OCR读者无法摸索,这显示了软件的糟糕状态和这种活动中的大脑缺陷。

    对于“一次一个符号”,Tex显然对符号的放置位置有规则。他们不能编写知道这些规则的软件?!tex甚至是公共领域!他们可以在他们的商业产品中“使用它”。

        3
  •  5
  •   Albert    15 年前

    根据 answers on Metaoptimize 以及 discussion on the Tesseract mailinglist 似乎还没有一个开放/免费的解决方案可以做到这一点。

    唯一的解决方案似乎可以做到这一点(但我无法验证,因为它是仅限Windows和非免费的),就像其他一些人提到的那样, InftyProject .

        4
  •  5
  •   Geremia    10 年前

    退房 Web Equation 它可以将手写的方程式转换为LaTex、MathML或Symboltree。我不确定引擎是否是开源的。

        5
  •  2
  •   Starkey    15 年前

    考虑到当前技术一次读取一个符号(请参见 http://detexify.kirelabs.org/classify.html )我怀疑完全数学方程是否存在OCR。

        6
  •  2
  •   Yaroslav Bulatov    15 年前

    infty工作得相当好。我以前的公司将它集成到一个应用程序中,它可以为盲人大声读出方程式,并从用户那里得到良好的反馈。

    http://www.inftyproject.org/en/download.html

        7
  •  1
  •   Richard Fateman    9 年前

    因为复杂公式的数学OCR输出可能会有错误——甚至人类也会遇到这种问题——所以您必须对结果进行校对,至少在它们很重要的情况下。然后,(人工)校对员将不得不更正结果,这意味着您需要一个数学公式编辑器。考虑到人类所需的努力(可能是复杂公式的有限语料库),您可能会发现将任务分配给人类更容易。

    作为一个研究问题,通过OCR阅读数学很有趣——你需要一个二维语法的形式主义加上一个符号识别器。
    除了这里已经提到的参考资料外,为什么谷歌不这么做呢?在加州理工学院、罗切斯特大学、滑铁卢大学和加州大学伯克利分校都做过一些工作。有多少是现成的?邓诺。

        8
  •  0
  •   Blindy    15 年前

    你知道,Win7中有一个应用程序就是为了这个: Math Input Panel . 它甚至可以处理手写输入(实际上是为此而设计的)。试一试,如果你有Win7,它是免费的!

        9
  •  0
  •   mPrinC    13 年前

    这里有一个很棒的短片: http://www.youtube.com/watch?v=LAJm3J36tLQ 解释如何训练优秀的读者识别数学公式。如果你已经使用了好的阅读器,最好坚持使用一种工具。当然不是免费软件:(