代码之家  ›  专栏  ›  技术社区  ›  fasseg

Apache Lucene:如何从文档中获取第一个匹配的子字符串

  •  0
  • fasseg  · 技术社区  · 15 年前

    我在web上找不到任何信息,stackoverflow告诉我如何从Lucene文档中获取第一个匹配的字符子序列。

    ATM我正在使用这个逻辑从Lucene检索结果:

            Document doc=searcher.doc(hit.doc);
            String text=doc.get("text");
            if (text.length() > 80){
                text=text.substring(0,80);
            }
            results.add(new SearchResult(doc.get("url"), doc.get("title"), text));
    

    如您所见,这只需要搜索文本的前80个字符,并将其与其他一些数据一起包装到SearchResult对象中。

    是否有可能检索到文本的第一个甚至是得分最高的子序列,该序列实际上包含任何搜索项?

    2 回复  |  直到 15 年前
        1
  •  2
  •   Community Mohan Dere    9 年前