0
|
Ferruccio Islam Bisceglia · 技术社区 · 1 年前 |
|
1
0
问题是Twitter(x.com)不会直接返回带有图片或原始帖子的网页。之后,他们使用JavaScript加载实际的网页。 Twitter试图阻止你通过简单的请求抓取页面,因为他们提供付费的API。API允许开发人员轻松访问内容。 即使你得到了真正的网页,它也不会包含任何图像。html文档只指向图像的地址。 |
|
2
0
除非您使用网站提供的某种API,否则无法使用请求模块从javascript动态渲染的网站下载图像。但是,您可以使用Selenium打开浏览器并呈现HTML代码。 如果您正确设置了Selenium,下面的代码将从一个示例twitter帖子中下载图片。
PS: 要打开浏览器,你首先需要安装它的网络驱动程序。上面的代码使用Firefox。例如,如果您使用的是Windows,则可以使用以下代码。
这将把一个名为geckodriver.exe的文件下载到用于打开浏览器的当前路径。 |
![]() |
Connor D · 从GET方法中向PUG模板发送推特数据 7 年前 |
![]() |
the_t_test_1 · 与tweepy取消推特链接 7 年前 |
![]() |
Varun · R: 自动在云端抓取和存储Twitter数据 7 年前 |
![]() |
Natalie · Python监督的ML文本概率分类 7 年前 |
![]() |
holo · 不支持Twitter浏览器通知 7 年前 |
![]() |
Bilal Butt · 如何从json文件中获取不同或唯一的字符串行 7 年前 |