![]() |
1
4
检测机器人的正确方法是通过主机条目(
甚至不要 另见 http://googlewebmastercentral.blogspot.com/2006/09/how-to-verify-googlebot.html |
![]() |
2
1
首先:简单地从已知搜索引擎的响应中剥离JSessionID,我们遇到了一些问题。最值得注意的是,为每个请求创建一个新会话会导致OutOfMemoryErrors(当您不使用Java时,为数千个活动会话保持状态对于大多数或所有服务器/框架来说肯定是个问题)。这可以通过减少会话超时来解决(如果可能,仅适用于bot会话)。所以,如果你想走这条路,就要得到警告。如果您这样做了,就不需要进行DNS查找。你在这里没有保护任何有价值的东西(与 Google's First Click Free 例如)。如果有人假装是机器人,通常情况下应该没问题。
相反,我建议继续跟踪会话(使用URL参数作为cookie的后备方案)并添加
canonical link tag
|
![]() |
3
0
我认为,你处理这个问题的方法不太正确。您不应该依赖会话跟踪机制来决定访问权限、记录恶意用户、检测机器人等。
|
![]() |
4
0
如果欺骗是你的主要顾虑,那么你的安全性就错了。你不应该给机器人比用户更多的权限,恰恰相反(这就是为什么用户可以登录,机器人可以访问)
如果你打算在没有身份验证的情况下给某人特权,那么它天生就有可能被欺骗。IP可以被欺骗。服务器-客户端通信可能被欺骗。等等 如果您依赖跟踪cookies来分析恶意行为,则需要修复该问题。在不要求恶意用户识别他/她自己的情况下,应该很容易获得良好的理解。
|
![]() |
Haim Ohayon · 这些链接之间有什么区别? 3 年前 |