url = urljoin('https://www.amazon.com', next_url)
for i in range(len(url)):
driver.get(url[i])
这些行执行以下操作:
-
url = urljoin('https://www.amazon.com', next_url)
以字符串形式获取URL,例如
https://www.amazon.com/some_source
并分配给
url
变量
-
for i in range(len(url))
遍历整数范围
0, 1, 2, 3, ... len(url)
并将每个任务分配给
i
变量
-
driver.get(url[i])
导航到
性格
例如
driver.get("h")
,
driver.get("t")
…
我不知道你到底想做什么,但我想你需要
url = urljoin('https://www.amazon.com', next_url)
driver.get(url)
更新
如果需要检查所有页面,请尝试添加
driver.find_element_by_xpath('//a/span[@id="pagnNextString"]').click()
在每一页刮擦之后。
还要注意
for product in products
永远不会导致
IndexError
,这样就可以避免使用
try
/
except
对于这个循环