![]() |
1
6
根据您的描述,您认为:
如果缺少一个单词,例如:
此外,您还可以按照@roadrunner的建议进行拆分
编辑: 您说您已经尝试了一些度量,如余弦相似性等。但是我怀疑您可能会从检查 Levenshtein Distance 相似性,我怀疑在这种情况下,除了提供的解决方案之外,还可以使用相似性。 |
![]() |
2
4
您也可以使用
其输出:
注:
因为我们只关心
|
![]() |
3
2
与DarkCygbus相似,但相似性基于其计数总字符而不是单词。另一方面,此脚本只检查了与完整单词的一致性(text\u 2.split())
|