代码之家  ›  专栏  ›  技术社区  ›  FrancoisTheFrenchOne

斯坦福德·科伦普(StanfordCoreNLP)可用的法国模型都是用哪种树库训练的?

  •  0
  • FrancoisTheFrenchOne  · 技术社区  · 7 年前

    根据这篇文章的标题,我想获得关于用于训练本页面提供的StanfordCoreNLP法语模型的数据集的最多信息( https://stanfordnlp.github.io/CoreNLP/history.html ). 我的最终目标是了解当使用斯坦福核心自然语言处理工具描述法语文本时,我可以期望输出的标记集。有人告诉我,模型是用树库训练的。法语有6种( http://universaldependencies.org/ ,法语部分): -FTB -原件 -红杉 -ParTUT公司 -普德 -口语 所以我想知道他们中的哪个是用来训练哪个法国模特的。

    我首先在java nlp用户专用的邮件列表(java nlp)上问了这个问题-user@lists.stanford.edu),但直到现在都没有用。

    那么,再一次假设上面描述的树库确实用于训练斯坦福核心nlp法语模型,可以在上面发布的链接中找到,是哪一个?或者,如果这里没有人知道,谁(姓名)会知道这个问题的答案?

    1 回复  |  直到 7 年前
        1
  •  0
  •   StanfordNLPHelp    7 年前

    对于所有对此感到好奇的人,以下是一些关于斯坦福大学CoreNLP法语数据集的信息:

    French POS tagger: CC (Crabbe and Candito) modified French Treebank
    French POS tagged (UD version): UD 1.3
    French Constituency Parser: CC modified French Treebank
    French NN Dependency Parser: UD 1.3
    

    还要注意,选区解析器 parse 无法像英语选区解析器那样将选区解析转换为依存关系解析。