|
|
1
3
你不是在找我 spidering screen scraping . |
|
|
2
2
我不得不同意Bombe的观点,它听起来更像是你想要HTML屏幕抓取。它需要大量的解析,如果你的抓取页面发生了变化,你的应用程序就会崩溃,但下面是一个小例子:
|
|
|
3
0
因为浏览器只是呈现底层内容,所以最灵活的方法是自己解析底层内容(html/css/js/随便什么)。 我将创建一个解析引擎来查找您的spider应用程序需要的东西。
|
|
|
Claudio · 如何使用Selenium下载PDF文件? 2 年前 |
|
|
hidde · 页面上的不同内容Apify网络爬行 6 年前 |
|
|
Tae · Python3中方法has\u key的替换 8 年前 |
|
Vega · 如何从DOM获取所有链接? 8 年前 |