代码之家  ›  专栏  ›  技术社区  ›  Richard H

将网页和外部链接资产保存为独立的静态资源

  •  5
  • Richard H  · 技术社区  · 15 年前

    我们需要尽可能准确地缓存网页,这样我们就可以在任何时间点返回并查看页面的版本。我们希望能够以真实的方式查看页面——使用正确的css、javascript、图像等。

    是否有任何操作系统库(任何语言)可以获取页面,下载所有外部链接的资产,并重新写入链接,使其指向本地缓存的资产?

    或者这是我们自己的滚动?

    谢谢

    编辑: 我意识到,如果不渲染动态生成的链接等,这将是不可能的100%,除非我们做DOM渲染。然而,就目前而言,我们或许可以不这样生活。

    3 回复  |  直到 15 年前
        1
  •  9
  •   Paulo Coghi    9 年前

    我建议: http://www.httrack.com/

    由于该软件是免费的、开源的,并且支持可视化界面和命令行,我相信您可以将其集成或自定义,以满足您的需求。

    请参见描述 :

    “HTTrack允许您将万维网网站从Internet下载到本地目录,递归地构建所有目录,将HTML、图像和其他文件从服务器下载到计算机。

    它安排了原始站点的相对链接结构。只需在浏览器中打开“镜像”网站的一个页面,就可以从一个链接浏览到另一个链接,就像在线查看一样。

    它还可以更新现有镜像站点,并恢复中断的下载。"

    在什么操作系统中可以运行它 :

    WebHTTrack 对于Linux/Unix/BSD:Debian、Ubuntu、Gentoo、RPM软件包(Mandriva&RedHat)、OSX(MacPorts)、Fedora和FreeBSD i386软件包。

    WinHTTrack 适用于Windows 2000/XP/Vista/Seven

    --

    使现代化 :项目处于活动状态,最新版本已在中提交 04/01/2017

        2
  •  1
  •   The Surrican    15 年前

    为什么不在页面上应用一个基本href,用相对绝对替换内部绝对链接,并保留其结构?

        3
  •  0
  •   Mark Schultheiss    15 年前

    可以使用mht/mhtml格式保存为统一文档。

    Wiki说明: http://en.wikipedia.org/wiki/MHTML

    快速搜索将显示一些用于执行此操作的代码源。