代码之家  ›  专栏  ›  技术社区  ›  Dawny33

如何向Mallet simpletager添加单词级功能?

  •  0
  • Dawny33  · 技术社区  · 8 年前

    我一直在经历 this blog post 其中包含一个SimpleTagger示例。

    上面写着:

    给定输入文件“示例”,如下所示:

    CAPITAL Bill  noun
            slept non-noun
            here non-noun
    where all but the last token on each line is a binary feature, and the last token on the line is the label name
    

    那么,如何在这里添加单词级功能呢?

    例如:单词中音节的数量、单词的长度等

    1 回复  |  直到 8 年前
        1
  •  1
  •   David Mimno    8 年前

    最后一个标记之前的所有内容都被视为功能。在此之前,您应该能够添加任意功能:

    CAP SYL1 CHAR4 Bill noun
    SYL3 CHAR9 responded non-noun
    ...