代码之家  ›  专栏  ›  技术社区  ›  ksuralta

是否有不使用搜索索引文件的开源Web搜索库?

  •  0
  • ksuralta  · 技术社区  · 17 年前

    你知道吗?

    谢谢

    3 回复  |  直到 17 年前
        1
  •  1
  •   Will Hartung    17 年前

    你的意思是:

    search.cgi

    #/bin/sh
    arg=`echo $QUERY | sed -e 's/^s=//' -e 's/&.*$//'`
    cd /var/www/httpd
    find . -type f | xargs egrep -l "$arg" | awk 'BEGIN { 
            print "Content-type: text/html"; 
            print "";
            print "<HTML><HEAD><TITLE>Search Result</TITLE></HEAD>";
            print "<BODY><P>Here are your search results, sorry it took so long.</P>";
            print "<UL>";
        }
        { print  "<LI><A HREF=\"http://yourhost.com/" $1 "\">" $1 "</A></LI>"; }
        END {
            print "</UL></BODY>";
        }'
    

    未经测试的。。。

        2
  •  1
  •   SquareCog    17 年前

    我不知道有任何相关的项目,但您可能想看看您选择的语言中的html解析器和xquery实现。您应该能够使用前者处理html的“现实生活”混乱,并编写一个搜索,该搜索几乎与您使用后者所希望的一样详细。

    我假设您将使用一组URL,这些URL要么提供,要么已经存储在本地,因为在嵌入式设备中实际抓取整个web、发现链接等的想法是完全不现实的。

    虽然有一个很好的html/xquery实现,但您确实拥有提取所有链接的工具。。

    我最初的回答实际上是要求澄清

    不知道你的意思。你如何想象一个没有索引的搜索工作?为每个查询爬网?通过管道传送到谷歌?或者您指的是您试图避免的特定类型的搜索索引文件?

        3
  •  0
  •   ksuralta    17 年前

    我想没有(至少这里的用户可以意识到这一点)。

    推荐文章