![]() |
1
1
请看一下NLTK,它是对NLP感兴趣的初学者的一个很好的资源。
http://www.nltk.org/
现在我了解了你的问题,下面是我的解决方案: 您可以开发一种受限词汇表,其中所有金额必须以$符号结束,或者任何时间必须以00:00和/或AM/PM结束,关于检测项目,您可以使用本体中的对象列表,如开放cyc。open cyc可以为您提供所有对象的列表,如啤酒、咖啡、面包和牛奶等。这将帮助您在短时间内检测到对象。不过,这将是一个非常模糊的方法。 |
![]() |
2
3
这似乎不需要完整的NLP。基于简单模式 information extraction 可能就足够了。基本思想是将文本标记化,然后识别/分类某些关键字,最后识别模式/短语。 在您的示例中,标记化为您提供“牙医”、“预约”、“星期一”、“时间”、“下午2点”、“地点”、“地点”。您的工具将认识到“星期一”是一周中的一天,“下午2点”是一个时间等。最后,您可以找到[时间]和[地点]这样的模式,并使用这些模式填充字段。 像这样的框架 GATE 可能会有帮助,但即使是这样也可能是一个比你真正需要的更大的锤子。 |
![]() |
feasega · 聚合物模拟-2个节点之间的最短路线,适用于所有节点 5 月前 |
![]() |
Alisa Petrova · 在有向图中更改一对顶点以创建循环 5 月前 |
![]() |
b39b332d · 使用C++标准库实现高效间隔存储 9 月前 |
![]() |
ABGR · 二叉树的直径——当最长路径不通过根时的失败案例 10 月前 |
![]() |
EpicAshman · 数独棋盘程序中同一列和同一行出现两次的数字 10 月前 |