代码之家  ›  专栏  ›  技术社区  ›  M. Az

通过Python使用导出按钮下载

  •  1
  • M. Az  · 技术社区  · 7 年前

    我有兴趣从晨星网站下载财务报表。这里有一个页面示例:

    http://financials.morningstar.com/cash-flow/cf.html?t=PIRC&region=ita&culture=en-US

    在右上角有一个导出到csv按钮,我想用Python单击它。按inspection,我有这个HTML标记:

    <div class="exportButton">
        <span class="icon_1_span">
           <a href="javascript:SRT_stocFund.Export()" class="rf_export">
           </a> ==$0
    

    我的想法是使用bs4-BeautifulSoup来解析(根本不确定是否需要解析)页面并找到按钮来单击它。类似于:

    quote_page = pageURL
    page = urlopen(quote_page)
    soup = BeautifulSoup(page, "html.parser")
    bs = soup.find(href="javascript:SRT_stocFund.Export()", attrs={"class":"rf_export"})
    

    显然,这不会返回任何结果。对于如何让Python导出表中的数据,您有什么建议吗?一、 e.自动下载csv文件的过程,而不是在网页上自己下载。

    非常感谢你!!

    2 回复  |  直到 7 年前
        1
  •  1
  •   Francisco Gonzalez    7 年前

    随着google chrome“http trace”的扩展,您可以知道,它不仅仅是一个链接:

    Export

    它可以做到,有了请求库。

    Example

    我认为,这是一种简单的方法(我认为,如果修改url参数,可以根据需要创建excel文件)。

    当做

        2
  •  0
  •   Vadim Toptunov    7 年前

    我会在“无头”模式下使用Selenium WebDriver。试试硒,它很容易理解和使用。:)