![]() |
1
4
使用反向索引:对于每个单词,存储一组对(docid,numOccurrences)。 然后,要查找所有可能与给定字符串相似的字符串,请浏览其单词并在反向索引中查找包含该单词的字符串。这样,您将得到一个表“(docid,wordmatchScore)”,它只自动包含wordmatchScore非零的条目。 有大量可能的优化;而且,您的代码是非常非最优的,但是如果我们要讨论减少字符串对的数量以进行比较,那么就是这样。 |
![]() |
2
3
加速
它还表明“a a”和“a”在这个测量中有100%的共同点… |
![]() |
Ben · 统计向量中的单词在字符串中出现的频率 6 月前 |
![]() |
bear_525 · 从列中删除中间名和首字母,并保存在单独的列中 7 月前 |
![]() |
asdfadf · 为什么具有相同内存值的字符串和整数打印方式不同? 8 月前 |
![]() |
user764754 · 防止多行原始字符串文字中出现新行字符 8 月前 |
![]() |
Bogaso · 从列表中返回与模式匹配的元素 8 月前 |
![]() |
Jasco · 如何使用VBA提取两个相似字符之间的字符串中的单词? 8 月前 |