我有兴趣从晨星网站下载财务报表。这里有一个页面示例:
http://financials.morningstar.com/cash-flow/cf.html?t=PIRC®ion=ita&culture=en-US
在右上角有一个导出到csv按钮,我想用Python单击它。按inspection,我有这个HTML标记:
<div class="exportButton">
<span class="icon_1_span">
<a href="javascript:SRT_stocFund.Export()" class="rf_export">
</a> ==$0
我的想法是使用bs4-BeautifulSoup来解析(根本不确定是否需要解析)页面并找到按钮来单击它。类似于:
quote_page = pageURL
page = urlopen(quote_page)
soup = BeautifulSoup(page, "html.parser")
bs = soup.find(href="javascript:SRT_stocFund.Export()", attrs={"class":"rf_export"})
显然,这不会返回任何结果。对于如何让Python导出表中的数据,您有什么建议吗?一、 e.自动下载csv文件的过程,而不是在网页上自己下载。
非常感谢你!!