代码之家  ›  专栏  ›  技术社区  ›  Claudio

如何使用Selenium下载PDF文件?

  •  0
  • Claudio  · 技术社区  · 2 年前

    我正在尝试从以下网站下载PDF: http://esaj.tjsp.jus.br/cjsg/getArquivo.do?conversationId=&cdAcordao=16548741

    因此,我要做的第一件事是创建一个time.sleep来手动解决reCAPTCHA(我不确定是否有可能实现自动化)。之后,我希望下载开始。然而,什么也没发生。

    以下是我的代码:

    from selenium import webdriver
    from selenium.webdriver.chrome.service import Service
    import time
    
    if __name__ == "__main__":
    
        url = "http://esaj.tjsp.jus.br/cjsg/getArquivo.do?conversationId=&cdAcordao=16548741"
        service = Service(executable_path='./chromedriver.exe')
        options = webdriver.ChromeOptions()
        
        options.add_experimental_option('prefs', {
             'download.default_directory': 'C:\\Users\....',
             'download.prompt_for_download': False,
             "download.directory_upgrade": True,
             'plugins.always_open_pdf_externally': True})
        
        driver = webdriver.Chrome(service=service, options=options)
        try:
     
            driver.get(url)
    
            print('Acesso')
    
            time.sleep(180)
            
            print('Sucesso!')
            
            driver.implicitly_wait(10)
            
            print('Download concluido...')
            
            driver.quit()
    
        except Exception as e:
            print(f"Ocorreu um erro: {e}")
            driver.quit()
    
    
    0 回复  |  直到 2 年前