|
|
1
2
你有没有考虑过关键字在1轴上的矩阵与文档在另一轴上的列表。一旦你找到了代表关键字的否决集,就要找到在初始结果集中找到的关键字集,然后找到一种方法,根据其他关键字引用的文档数量或插入初始结果集中的次数对它们进行排名。 |
|
|
2
2
我尝试了许多不同的方法,取得了不同程度的成功。最后,我认为最好的方法在很大程度上取决于搜索的领域/主题,以及用户如何形成查询。 你关于存储以前搜索的想法在我看来是合理的。我很想知道它在实践中是如何工作的(我的意思是,以最真诚的方式——有许多细微差别可能会导致这些技术在“现实世界”中失败,特别是在数据稀疏的情况下)。 以下是我过去使用过并在文献中看到的一些技巧:
|