![]() |
1
2
您感兴趣的问题是从半结构化源中提取信息。 http://en.wikipedia.org/wiki/Information_extraction 我认为你应该下载一些这方面的研究论文,以了解可以做什么和不能做什么。 |
![]() |
2
0
我觉得机器做不到。 每一份简历都会有不同的格式和布局。 你能做的最好的就是设计一个内部格式,并手动复制里面的每一个简历内容。或者请候选人填写你的表格(不会有太多麻烦)。 |
![]() |
3
0
我认为问题应该分成两个搜索域:
首先,通过搜索语法上重要或重要的项目,可以找到与专有名称相关的信息。即英语只把句子的第一个词和专有名词大写。对于语法规则,您可以查找单词首字母大写的所有单词,并对照包含单词和类型的数据库(即Bob-名称,Elon-地点,England-地点)进行检查。 第二:公式化的信息。这是关于电子邮件地址、电话号码和物理地址的更多信息。所有这些都有一个不改变的特定格式。使用regex并使用算法检测匹配的质量。 当心: 语法规则根据语言而变化。德语把每个名词都大写。最好在应用规则之前检测文档的语言。另外,这个(有时还有我的简历)的另一个问题是它是如何设计的。如果简历不是用文本编辑器[设计器工具]设计的,则文本可能不对齐,或者是位图格式。 TL;Dr版本:NLP技术可以帮助您很多。 |
![]() |
Hakanai · 为什么这个Lucene查询没有返回命中率? 9 年前 |
![]() |
Shahtaj Khalid · 在文本文件中显示输出 10 年前 |
![]() |
mel · Elasticsearch:在我的英语分析器上添加同义词过滤器 10 年前 |
![]() |
myang · 如何在一个句子中列出所有表示动物的英语术语? 10 年前 |