代码之家  ›  专栏  ›  技术社区  ›  David Conde

Lucene批量索引的优化

  •  2
  • David Conde  · 技术社区  · 14 年前

    这是一个问题:

    有人碰到这个问题吗?

    谢谢和问候

    2 回复  |  直到 14 年前
        1
  •  2
  •   David Conde    10 年前

    我会采取另一种选择,我已经决定公布结果,所以如果有人应该面对同样的问题,可能会找到另一条路。

    Lucene.net有一个有趣的特性,允许合并两个索引,因此我的想法是将我的内容索引到几个较小的索引中,并使用合并特性将它们连接起来。

    这对我有效。我测试了这个解决方案,索引WordNet来对它执行查询,并且完美无瑕地工作。

        2
  •  1
  •   Adrian Conlon    14 年前

    假设您没有访问探查器的权限( Redgate ANTS 很好),那么:

    1. 确保您使用的是SVN构建的lucene。颠覆版本2.9 .x比早期版本好很多,特别是关于索引的速度。
    2. 使用默认的合并因子等。Lucene在这方面似乎比我尝试调整要好得多。
    3. 最后(也许是最重要的!)索引很慢是否重要?如果你一年只需要做一两次,我会说别担心。(除非这是一个学习练习或类似的活动)

    希望能帮上忙,