代码之家  ›  专栏  ›  技术社区  ›  RageZ

Zend_-Lucene CJK支持

  •  2
  • RageZ  · 技术社区  · 15 年前

    有人知道Zend_Lucene类是否支持CJK(中文-日韩文)。

    我想在我自己的网站上使用它,这是英语和日语的唯一问题。

    此外,如果有人对CJK版本的Java版本有一些修改,也会很感激。

    谢谢

    1 回复  |  直到 15 年前
        1
  •  2
  •   Mark Basmayor    15 年前

    目前,这些是Zend_Lucene中唯一内置的UTF-8兼容分析仪。

    • zend_search_lucene_analysis_analyzer_common_utf8
    • zend_search_lucene_analysis_analyzer_common_utf8num
    • zend_search_lucene_analysis_analyzer_common_utf8_不区分大小写
    • zend_search_lucene_analysis_analyzer_common_utf8num_不区分大小写

    您可以使用以下代码来使用它们:

    Zend_Search_Lucene_Analysis_Analyzer::setDefault(
    new Zend_Search_Lucene_Analysis_Analyzer_Common_Text());
    

    如果需要,还可以构建自己的分析器。

    另一种解决方案是使用JavaLucene构建索引,并在PHP中使用该索引,因为它们应该是兼容的。不过我还没试过。

    Zend_Search_Lucene源自Apache Lucene项目。目前(从zf 1.6开始)支持的lucene索引格式版本为1.4-2.3。

    您可以在Zend框架手册中了解更多有关这方面的信息。 link text