代码之家  ›  专栏  ›  技术社区  ›  Dan

在网络服务器上跟踪旧的上传文件-你怎么知道什么不再被使用?

  •  2
  • Dan  · 技术社区  · 15 年前

    用户可以将文件上传到服务器,这些文件将永远有效地存储。

    我想知道是否有人有跟踪孤立文件的想法。 我的一些想法涉及到记录每次上传,但是这些文件通常是在HTML中引用的,这不容易跟踪。

    文件可以不使用,但仍然可以被引用。我可以在上面做一个完整的文本搜索,但这是非常残忍的手段。

    我只是放弃让他们变老吗?

    1 回复  |  直到 12 年前
        1
  •  3
  •   user290043    15 年前

    我不知道您的情况,但我过去所做的是将所有旧文件(图像)移到“图像”文件夹的一个文件夹中,然后使用XENU检查所有HTML页面中的链接。在链接验证结束时,XENU返回了一个404列表,然后我使用404列表编写了一个脚本,将文件从备份位置移回images文件夹。

    这很管用…仍然监视日志文件几个星期,不过只是为了以防万一我错过了什么。

    顺便说一句,XENU是一个免费的应用程序,通过给它一个起始页来帮助你找到断开的链接。然后它会在该页面中找到链接,以便对整个网站进行爬行。如果在爬行过程中找不到链接到这些文件的页面,则需要额外的起始页。