|
|
1
0
您可能想看看Perl的lwp库(我知道它不是php,但对于屏幕抓取、Web单元测试等非常有用): |
|
|
2
3
我同意莱斯的观点。curl+charles(或fiddler、firefox的篡改数据扩展、wireshark等)是我一直这样做的。我发现的一个技巧是,有些网站需要三步流程:
别指望curl的cookie jar和cookie文件能帮上大忙。您最好使用一个简单的regex从头中解析出会话ID和cookie。 希望这有帮助! |
|
|
3
1
如果你需要做大量的图形用户界面的工作,你最好使用某种可脚本化的浏览器。如果需要使用PHP,请查看curl: http://us2.php.net/curl |
|
|
5
0
我在这方面有相当的经验。我以前用过卷发,但用它不好玩。特别是很多时候,站点交换XSRF令牌、传递隐藏变量或设置各种cookie。用卷发追踪这一切变得困难。至少对我来说。 然后我研究了硒,我喜欢它。有两件事-1)安装Selenium IDE(仅在Firefox中工作)。2)安装Selenium RC服务器 在启动SeleniumIDE之后,请转到您试图自动化的站点,并开始记录您在该站点上所做的事件。将其视为在浏览器中录制宏。然后,您将得到所需语言的代码输出。 正如您所知,browsermob使用Selenium进行负载测试和自动执行浏览器上的任务。 我上传了一个PPT,这是我之前做的。这样可以节省你很多时间- http://www.4shared.com/get/tlwT3qb_/SeleniumInstructions.html 在上面的链接中,选择常规下载选项。 |
|
|
NoUsername9 · 使用Apify和Puppeter抓取URL 5 年前 |
|
|
Alok Mishra · 如何自动点击“内容”按钮 7 年前 |
|
|
Ike · Python Selenium错误-当webdriver 8 年前 |
|
|
ilyas · 使用网站查询获取数据[已关闭] 8 年前 |