|
|
1
6
根据您的描述,您认为:
如果缺少一个单词,例如:
此外,您还可以按照@roadrunner的建议进行拆分
编辑: 您说您已经尝试了一些度量,如余弦相似性等。但是我怀疑您可能会从检查 Levenshtein Distance 相似性,我怀疑在这种情况下,除了提供的解决方案之外,还可以使用相似性。 |
|
2
4
您也可以使用
其输出:
注:
因为我们只关心
|
|
|
3
2
与DarkCygbus相似,但相似性基于其计数总字符而不是单词。另一方面,此脚本只检查了与完整单词的一致性(text\u 2.split())
|
|
Ben · 统计向量中的单词在字符串中出现的频率 1 年前 |
|
|
bear_525 · 从列中删除中间名和首字母,并保存在单独的列中 1 年前 |
|
|
asdfadf · 为什么具有相同内存值的字符串和整数打印方式不同? 1 年前 |
|
|
user764754 · 防止多行原始字符串文字中出现新行字符 1 年前 |
|
|
Bogaso · 从列表中返回与模式匹配的元素 1 年前 |
|
|
Jasco · 如何使用VBA提取两个相似字符之间的字符串中的单词? 1 年前 |