代码之家 › 专栏 › 技术社区 › ksuralta

是否有不使用搜索索引文件的开源Web搜索库?

search

0

ksuralta · 技术社区 · 17 年前

你知道吗?

谢谢

3 回复 | 直到 17 年前

1

Will Hartung 17 年前

你的意思是:

search.cgi

#/bin/sh
arg=`echo $QUERY | sed -e 's/^s=//' -e 's/&.*$//'`
cd /var/www/httpd
find . -type f | xargs egrep -l "$arg" | awk 'BEGIN { 
        print "Content-type: text/html"; 
        print "";
        print "<HTML><HEAD><TITLE>Search Result</TITLE></HEAD>";
        print "<BODY><P>Here are your search results, sorry it took so long.</P>";
        print "<UL>";
    }
    { print  "<LI><A HREF=\"http://yourhost.com/" $1 "\">" $1 "</A></LI>"; }
    END {
        print "</UL></BODY>";
    }'

未经测试的。。。

2

1

SquareCog 17 年前

我不知道有任何相关的项目,但您可能想看看您选择的语言中的html解析器和xquery实现。您应该能够使用前者处理html的“现实生活”混乱,并编写一个搜索,该搜索几乎与您使用后者所希望的一样详细。

我假设您将使用一组URL,这些URL要么提供,要么已经存储在本地,因为在嵌入式设备中实际抓取整个web、发现链接等的想法是完全不现实的。

虽然有一个很好的html/xquery实现,但您确实拥有提取所有链接的工具。。

我最初的回答实际上是要求澄清

不知道你的意思。你如何想象一个没有索引的搜索工作?为每个查询爬网?通过管道传送到谷歌?或者您指的是您试图避免的特定类型的搜索索引文件?

3

0

ksuralta 17 年前

我想没有(至少这里的用户可以意识到这一点)。