代码之家  ›  专栏  ›  技术社区  ›  Andras Zoltan

站点地图应该有*每*个URL

  •  8
  • Andras Zoltan  · 技术社区  · 14 年前

    我有一个拥有大量(好吧,数千或数万)动态URL的站点,加上一些静态URL。

    从理论上讲,由于主页上存在一些狡猾的SEO链接,任何蜘蛛都有可能通过蜘蛛友好搜索来爬行网站并发现所有动态URL。

    考虑到这一点,我真的需要担心花费大量精力来生成包含所有这些URL的动态站点地图索引吗,还是应该简单地确保所有主要静态URL都在其中?

    我用这种实际的方式产生这个问题并不令人担忧,我只是在质疑 事实上做到了 .

    的确,谷歌常见问题解答(是的,我知道他们不是唯一的搜索引擎!)关于这一点,建议在站点地图中包含可能不会被爬行发现的URL;基于这一事实,如果您的站点中的每个URL都可以从另一个站点访问,那么您在站点地图中真正需要的唯一URL就是您的主页吗?

    2 回复  |  直到 14 年前
        1
  •  5
  •   Guffa    14 年前

    如果有不止一种方法可以访问页面,您应该为每个包含实际内容的页面选择一个主URL,并将这些URL放到站点地图中。也就是说,站点地图应该包含指向实际内容的链接,而不是指向同一内容的所有可能的URL。

    还可以考虑将规范的元标记放在具有这个主URL的页面中,这样蜘蛛就可以识别一个页面,即使它可以通过不同的动态URL访问。

    蜘蛛只花有限的时间搜索每个网站,所以你应该让它很容易找到实际的内容尽快。站点地图是一个很大的帮助,因为您可以使用它直接指向实际的内容,这样蜘蛛就不必寻找它了。

    我们使用这些方法取得了相当好的结果,现在Google索引了80-90%的动态内容。:)

        2
  •  1
  •   Matt Mitchell    14 年前

    在一个这样的播客中,他们谈到了在站点地图中可以包含/提交的链接数量的限制(每页大约500个,页面限制基于pagerank?)以及如何在多个页面上打断它们。

    鉴于此,我真的需要担心吗 关于付出努力生产 动态站点地图索引,其中包括 所有这些URL,或者我应该 确保所有主要静态URL 在那里?

    我的印象是,站点地图不一定是关于断开连接的页面,而是关于增加现有页面的爬行。根据我的经验,当一个站点包含一个站点地图时,即使是显著链接到的小页面也更有可能出现在谷歌的搜索结果中。根据站点的pagerank/inbound链接等,这可能不是什么问题。