![]() |
1
0
那个站点正在使用js脚本更新它的元素,所以你不能单独使用beautifulsoup,你必须使用自动化。 下面的代码不起作用,因为元素在几毫秒后更新。它将首先显示所有的品牌,然后它将更新和显示选定的品牌,所以使用自动化。
代码:(selenium+bs4)
我已经注释掉了headerlesschrome,因为当你打开它时,你会得到一个对话框按钮,关闭它后,你可以获取产品的详细信息。在无浏览器的自动化系统中,您将无法做到这一点(无法回答这个问题)。不太擅长硒的概念)
别忘了安装:
|
![]() |
2
0
你只需要做
|
![]() |
3
0
页面正在使用java脚本创建您想要的链接,您不能刮取该链接,您需要复制页面请求,在这种情况下,页面正在发送post请求:
这是发送post请求的url:
页面可能还需要标头,因此请确保模拟浏览器发送的请求。 |
![]() |
Cam · Pandas列表日期到日期时间 7 月前 |
![]() |
LMC · Numpy数组布尔索引以获取包含元素 8 月前 |
![]() |
vr8ce · 非成对标记中特定字符的正则表达式 8 月前 |
![]() |
ShaAnder · 为什么sqllachemy返回的是类而不是字符串 9 月前 |
![]() |
Pernoctador · Python映射可以复制吗?我需要参考地图 9 月前 |