代码之家  ›  专栏  ›  技术社区  ›  jahmax

是否有任何python库来抓取搜索引擎的结果?

  •  0
  • jahmax  · 技术社区  · 14 年前

    我正在寻找一个python库从搜索引擎(google,yahoo,bing等)中刮取结果。

    http://github.com/kevinw/xgoogle/tree/253db7ddc8603a9dcb038ae42684cf3499a22a4b

    有人知道多个搜索引擎有一个吗?

    3 回复  |  直到 14 年前
        1
  •  1
  •   nate c    14 年前

    Scrapy 是一个非常酷的刮削框架,但是您将有代码/配置它来为您想要的站点工作。

        2
  •  0
  •   spyderman4g63    14 年前

    写起来并不难。我通常只使用php。查看curl以检索页面,然后是dom对象和domxpath。您可以使用xpath来选择所需结果的部分。

    如果安装firebug和firexpath,Xpath非常简单。我现在正在做一个职位检查器。相同的想法,但它返回一个基于关键字的域的位置。

        3
  •  0
  •   Ihor Patsian Ankit Hota    5 年前

    你还能尝试什么:

    • 使用请求
    • 使用硒
    • 使用第三方google库(据我所知,所有库都已弃用)

    但是你最终会被阻止,所以最好使用Google支持的API或者其他付费API。

        4
  •  -1
  •   3ppps    9 年前

    刮刀,你可以刮掉必应,谷歌,拜达,雅虎 link