![]() |
1
4
从html到pdf的web工具包非常完美,甚至可以生成jpg |
![]() |
3
2
嗯,这是 DumpRenderTree 作为WebKit测试套件的一部分使用的工具。我不确定它是否适合变成一个独立的工具,但它会按照您的要求(呈现html、运行javascript并将其呈现树转储到磁盘)。 |
![]() |
4
2
由于javascript可以对web页面的文档对象模型(document object model,dom)进行很多操作,因此似乎要准确地抓取任意页面的内容,您不仅需要运行javascript引擎,还需要页面的完整而准确的dom表示。只有当你有一个真正的浏览器引擎实例时,你才能得到这样的东西。可以使用嵌入式的、不显示的webkit或gecko引擎来实现这一点,然后在适当的加载延迟以允许脚本执行之后,只需以html格式转储dom内容。 |
![]() |
6
1
我认为qt有一个示例代码,它使用包含的webkit将页面呈现为pixmap。从那里到一个完整的cli实用程序只是定义您的需要。 当然,对于大多数屏幕抓取需要你想要的文字,而不是一个像素…如果那是你想要的,最好去看看犀牛 |
![]() |
7
0
有JAVA的眼镜蛇引擎( http://lobobrowser.org/cobra.jsp ,它处理javascript(它也有一个渲染器,但这是可选的)。我从来没用过,但听说过很多好话。 |
![]() |
8
0
让webview呈现一个页面而不显示任何内容是非常少的代码,但它必须是一个gui应用程序。它们也可以使用命令行参数,并隐藏窗口。直接使用webkit在工具中是可能的。 除了objective-c webkit中复杂的dom访问之外,它还可以注入javascript,并与jquery一起创建一个很好的抓取解决方案。不过,我不知道有什么通用应用程序会这么做。 |
![]() |
code-geek · Jquery根据单选按钮选择隐藏或显示文本字段 5 月前 |
![]() |
Alex · 在轻量级中同时解构和不解构变量 5 月前 |
![]() |
Ângelo Rigo · ReactJS映射:如何迭代[关闭] 5 月前 |
![]() |
bairog · 从按属性筛选的对象数组字典中创建值数组 5 月前 |
![]() |
lokiuucx · JS对象属性返回未定义,尽管对象属性应该有值 5 月前 |