在线代理喜欢什么
https://www.hidemyass-freeproxy.com/
工作我正在寻找一个后端不可知的解释。
我对它们的工作原理有以下想法,但在我的思考过程中存在一些差距:
-
用户想访问google.com,所以“google.com”作为X-Proxy-Url头的值发送到代理服务器
-
代理程序使它变得神奇,将google.com的HTML返回给用户
-
当proxy返回被代理的网站时,这个被代理的google.com中的任何链接都被到代理服务器的特殊链接所取代,以代理进一步的请求。
以上内容正确吗?如果是,下面是我的进一步问题。
-
如果代理代表用户向google.com提出请求,它不会像典型的网络爬虫一样被屏蔽吗?
-
它如何处理所有相关的资产,如CSS、图像、字体等,以便它们也通过代理?或者他们不通过代理人?
-
它是如何处理被代理的谷歌网站中的所有链接的,以便这些链接也通过代理?
我自己调查了一下,似乎它用指向代理的特殊链接替换了所有链接。