![]() |
1
0
我猜这是因为这个网站使用Ajax来填充你所说的“无限”滚动列表。 您可能会发送一个HTTP请求并获得初始页面(顺便说一句,在我的浏览器中,我收到了6张图片,分别是24张,而不是20张;考虑到这一点,可能我的客户机最初也只得到了20张,最后得到了4张w/ajax…),您需要通过ajax请求来完成分页槽。 乍一看,页面的XHTML和相关的javascript非常密集,有些模糊,需要一段时间才能定向…分析此页的另一种方法是使用数据包嗅探器(例如 wireshark )并捕获向下滚动时发生的请求。 本质上,这可能会暴露某种形式的Ajax请求,然后您可以轻松地用Java进行仿真。通常,Ajax响应很容易解析其任何性质(XML、Jason、Gzip…)。 这个布局良好的计划的一个可能障碍是,如果Ajax响应中返回的数据是加密的,例如,额外的图像捆绑在某种信封中,然后您需要发现其格式。 根据手头的实际任务,您可以尝试其他选择,例如 GreaseMonkey (在火狐上)或类似的工具。
必应API怎么样?
|
![]() |
2
0
你在模拟浏览器?Bing引擎是否没有程序入口点——一个Web服务或者其他——这会使您的任务更容易。 edit:sdk显示在此处: http://msdn.microsoft.com/en-us/library/cc980922.aspx |
![]() |
3
0
只是想直接回答这个问题: 必应使用Ajax(当然)进行无限滚动。每一个“勾选”都基于一个简单的Ajax GET请求,该请求用于获取新图像。 例如,该URL根据查询“max payne”以“htmlraw”格式返回30个结果(121-151)。 http://www.bing.com/images/async?q=max+payne&format=htmlraw&first=121 编辑: 它也适用于原始URL,只需将&first=number添加到querystring。例子: www.bing.com/images/search?q=payne&go=&form=qblh&scope=images&filt=all&first=10 我正在构建自己的批量图像收集器(为我自己的“学习项目”),我发现它是这样分页的。 仅供参考,谷歌和必应很容易,雅虎和Altavista(冗余,因为他们的结果来自雅虎)是更大的问题-他们不张贴直接链接到原始图像。 玩得高兴!:) |
![]() |
4
0
这可以通过使用 计数 参数。例如,我试图得到 https://api.cognitive.microsoft.com/bing/v7.0/images/search?q=shoes&mkt=en-us&count=30 “调用并返回30个图像。 |
|
callum · 如何识别数组中与给定序列不匹配的元素? 1 年前 |
![]() |
Sab · 输入为空时,搜索结果元素未隐藏 3 年前 |
![]() |
Chaz Cosby · 如何添加更改api地址的搜索栏? 3 年前 |
![]() |
user3669555 · 多维数组搜索部分单词或短语并移除键 7 年前 |
![]() |
Yohan · 根据用户输入显示或隐藏div 7 年前 |
|
Shasocais · Prolog,基本情况失败的问题 7 年前 |
|
Den · C#在列表框中搜索项目1 7 年前 |
![]() |
Eugene Barsky · Perl 6中多针的索引 7 年前 |