代码之家  ›  专栏  ›  技术社区  ›  Ritwik Bose

自然语言分析工具:什么是存在的,什么不是[关闭]

  •  8
  • Ritwik Bose  · 技术社区  · 15 年前

    我正在为我正在从事的一个项目寻找各种NLP工具,现在我发现最有用的是斯坦福NLP项目。

    有人知道有没有其他工具对语言理解者有用吗?

    更重要的是,有没有不存在的工具?

    最具体地说,我正在寻找一个用于形态音素分析等的api。

    编辑:我是一名学者(从事研究项目的学生),主要寻找开源或至少是开放api项目。

    4 回复  |  直到 15 年前
        1
  •  6
  •   ferdystschenko    15 年前

    我建议您看看以下内容:

    1. Open NLP , LingPipe , NLTK Gate , UIMA . 所有这些都提供了解析器和词干分析器(即,它们不会返回单词的词根,而是词干)。有些还提供柠檬汁。
    2. 收集NLP工具的网站。这些只是其中的一小部分: wiki Language Technology World the website of the compling dep. at Heidelberg University

    我不知道有什么工具可以返回单词的词根,但是,正如我所说的,有词干分析器和lemmatizer。尝试柠檬化 Tree Tagger Morpha

    一旦您更明确地知道您需要什么,您就可以搜索 Corpora List 或者在那里发布一个问题。

        2
  •  3
  •   mjv    15 年前

    NTLK 是一个有趣的工具包,它允许构建基于NLP的应用程序。这可用于实际应用,例如需要词性标记,或实现简单分类器或实体提取器。

    语言理解者 “然而,应用程序将包括,但这听起来可能超出了基于NLTK的范围。
    完整地阅读这个问题及其对形态语音学的引用,似乎证实了NLTK可能不会很好地满足OP的目的;据我所知,NTLK不提供在这个级别处理文本的模块。不过,您可能想亲自检查一下,因为NLTK是一个广泛而活跃的项目,并且可能在这一领域看到了最近的增加。

        3
  •  3
  •   tomcat23    15 年前

    我想附带一个指向MontyLingua python包的链接,可以在这里找到。我认为它使用了与nltk不同的解析器。

    http://www.fslog.com/2008/09/20/montylingua3-gpled-fork-of-montylingua/ 你可以用谷歌搜索与nltk的比较。

        4
  •  1
  •   Drewch    12 年前

    Maluuba 刚刚向他们的自然语言处理器发布了一个API。可以在 http://developer.maluuba.com .

    Maluuba为此编写了三个库:

    Python库: https://github.com/maluuba/napi-python

    Ruby库: https://github.com/maluuba/napi-ruby

    https://github.com/maluuba/napi-java

    关于it的威力,请将此查询作为可提取内容的示例:

    >> client.interpret phrase: 'Set up a meeting with Bob tomorrow \
              night at 7 PM to discuss the TPS reports'
    => 
        {:entities=>
          {
            :daterange=>[{:start=>"2012-11-15", :end=>"2012-11-16"}],
            :title=>["meeting to discuss the tps reports"],
            :timerange=>[{:start=>"12:00:00AM", :end=>"12:00:00AM"}],
            :contacts=>[{:name=>"bob"}]
          },
         :action=>:CALENDAR_CREATE_EVENT,
         :category=>:CALENDAR
        }