|
|
1
1
代码失败的原因之一是,您不使用cookies。网站似乎需要这些来允许分页。 提取感兴趣数据的一种简洁方法如下:
除最后一页外,所有页都有一个“下一页”按钮。所以我们用这些知识循环直到下一个按钮消失。当它确实-意味着到达了最后一页-按钮被替换为一个“li”-标记,类为“next hidden”。这只存在于最后一页 现在我们可以开始循环了
这将滚动,直到没有更多的网页存在-无论有多少子页将在网站上。 我在上面的评论中的观点仅仅是,如果在代码中遇到异常,那么pagecount永远不会增加。这可能不是你想做的,这就是为什么我建议你更多地了解整个尝试的行为,除非最终达成交易。 |
|
|
2
0
我也被唬住了,因为请求相同的回答,忽略了页面参数。作为一个肮脏的灵魂,我可以先给你设置
|
|
|
Stackie · 无法使用Selenium访问废料数据的链接 1 年前 |
|
|
Canberra · 从网站上删除纬度和经度 1 年前 |
|
|
zero · bs4方法访问维基百科页面:获取信息框 1 年前 |
|
|
Reonard1 · Web报废中的AttributeError 1 年前 |