|
|
1
4
我很确定鲁辛已经足够了。我们解决了类似的任务,做得很好。这里有一些提示,我建议您回顾一下我在Lucene.Net上的项目。
不可搜索字段(徽标、社交资料): 三种语言和多个字段:
|
|
|
2
5
好书: Lucene in Action (2nd edition)
这个 Tf-Idf 你基本上要做的就是 boost your title field ,因此它变得更加相关。你也可以 change the scoring mechanism 玩得高兴。如果你搞不懂的话,会有很好的支持 Lucene mailinglist . |
|
|
3
2
基本上,你正在努力提高你的搜索相关性。 我建议你读一下格兰特·英格索尔的 Debugging Search Application Relevance Issues 还有他的 Optimizing Findability in Lucene and Solr Practical Relevance slides . |
|
|
4
1
Lucene或Solr会做这项工作。索尔是建立在鲁肯之上的, see here for more info 我会和索尔一起去。下载+设置简单快捷。开始学习教程和我的 link collection . solr的关联性应该很好,而且很容易调整。
然后选择dismax查询处理程序,您可以选择具有某些属性的文档。 E、 g.对于完整配置文件的百分比,您可以定义一个单独的字段“配置文件完整性”,然后您可以将配置文件完整性添加到dismax handler的bf(boostfunction):配置文件越完整,这些文档将得到增强。
“可能带有徽标的”可以通过boost查询解决:
如果你需要进一步的帮助,请不要犹豫发表评论。 |