|
|
1
28
我建议 PHP Simple HTML DOM Parser 在您从页面中抓取HTML之后。它支持无效的HTML,并提供了一种非常简单的方法来处理HTML元素。 |
|
|
2
5
如果你抓取的页面是有效的X(HT)ML,那么 PHP's built-in XML parsers 会做的。 我在抓取PHP库方面没有取得多大成功。如果你喜欢冒险,你可以试试 simplehtmldom 我推荐 Hpricot 对于Ruby或 Beautiful Soup 对于Python,两者都是 极好的 HTML解析器。 |
|
|
3
5
我还推荐“简单HTML DOM解析器”。“这是一个很好的选择,特别是如果你熟悉jQuery或JavaScript选择器,那么你会发现自己在家里。 |
|
|
4
5
和我一起工作很开心 htmlSQL ,这并不是一个高端解决方案,但使用起来非常简单。 |
|
|
5
3
使用PHP进行HTML抓取,我建议使用cURL+regexp或cURL+一些DOM解析器,尽管我个人使用cURL+regexp。如果你对正则表达式有深入的了解,它有时实际上更准确。 |
|
|
6
2
我的成绩很好 Simple Html DOM Parser 上面也提到过。然后是 tidy Extension for PHP 这也非常有效。 |
|
|
7
2
我不得不在主机1和1上使用curl。 http://www.quickscrape.com/ 这就是我使用Simple DOM类想到的! |
|
|
NoUsername9 · 使用Apify和Puppeter抓取URL 5 年前 |
|
|
Alok Mishra · 如何自动点击“内容”按钮 7 年前 |
|
|
Ike · Python Selenium错误-当webdriver 8 年前 |
|
|
ilyas · 使用网站查询获取数据[已关闭] 8 年前 |