代码之家  ›  专栏  ›  技术社区  ›  David Rabinowitz

正在寻找信息检索/文本挖掘应用程序或库

  •  1
  • David Rabinowitz  · 技术社区  · 16 年前

    4 回复  |  直到 16 年前
        1
  •  3
  •   Community Mohan Dere    8 年前

    a look at R 它有大量的文本挖掘包: have a look at the Natural Language Processing view 。特别是,看看 tm 包裹。以下是一些相关链接:

    此外,R还提供了许多解析HTML或XML的工具。有 a look at this question for an example using the RCurl and XML packages .

    编辑: 你可以 integrate R with Java with JRI 这是一个使用非常广泛的包,有很多例子。 You can also see these related questions .

        2
  •  2
  •   ssn    16 年前

    • LingPipe - LingPipe是一套用于人类语言语言分析的Java库。
    • Lucene - Apache Lucene是一个完全用Java编写的高性能、功能齐全的文本搜索引擎库。
        3
  •  0
  •   David Rabinowitz    16 年前
        4
  •  0
  •   Lesmana    13 年前

    我使用Flex和C++制作的自定义解析器用于类似目的。我建议你看看java中的解析器生成器(javaCC.jj文件) javacc-faq