代码之家  ›  专栏  ›  技术社区  ›  Ali Neishabouri

我是否需要提供句子来训练Spacy NER,或者段落是否合适?

  •  1
  • Ali Neishabouri  · 技术社区  · 7 年前

    我正在尝试训练一种新的Spacy模型,以识别对法律条款的引用。我开始使用空白模型,并根据文档中给出的示例训练ner管道。

    即使输入点上有几千个,经过训练的模型的性能也很差。我在想为什么。

    一个可能的答案是,我给出的是完整的段落,而不是示例中的句子。这些段落中的每一段都可以多次提及法律条款。这是一个可能的问题吗?

    原来我在代码中犯了一个巨大的错误。段落没有错。只要你的代码真的提供给spacy。

    1 回复  |  直到 5 年前
        1
  •  0
  •   syllogism_    7 年前

    段落应该很好。你能举一个输入数据点的例子吗?