代码之家  ›  专栏  ›  技术社区  ›  Ryan Printup

robots.txt不允许空白PHP页面并包含?[已关闭]

  •  0
  • Ryan Printup  · 技术社区  · 11 年前

    我是否应该禁止robots.txt中的某些PHP页面,这些页面不是用来向用户显示内容的,而是运行一个脚本并返回空白或输出很少的代码,以便在其他地方使用?

    示例:

    • 显示为空白的PHP页面。示例是发送电子邮件的PHP页面
    • Ajax调用的PHP页面,不输出任何内容。
    • Ajax调用的PHP页面,并输出JSON或XML等响应代码。
    • 包括页面标题或配置文件的模板等页面。
    • 只需重定向到另一个页面的PHP页面。

    我感谢你们的帮助。

    1 回复  |  直到 11 年前
        1
  •  2
  •   John Conde    11 年前

    这些都是搜索引擎不希望或不需要抓取和索引的内容的优秀示例。您应该使用robots.txt文件阻止这些。特别是如果爬行它们会导致只供人类食用的动作发生。

    仅供参考,includes和config文件不应位于您的webroot中,因此爬网程序或用户无法通过web访问。如果是,你应该考虑移动它们。