|
|
1
1
一百万 例如,如果你只有480个,这远远不够训练一个好的模型。 我建议您对数据集进行预处理,以自动添加标记,如示例中所示。在伪python中是这样的:
对于标记数据,您可以使用传统的NER系统,如CRF。 Here 这是一个在Python中使用spaCy的教程。 |