代码之家 › 专栏 › 技术社区 › CÄtÄlin George FeÈtilÄ

如何用lxml解析带有表单的结果页?

lxml python

CÄtÄlin George FeÈtilÄ · 技术社区 · 14 年前

我尝试用表单解析第二页。我使用以下链接中的示例代码源代码: http://blog.ianbicking.org/2007/09/24/lxmlhtml/ http://www.infofer.ro/ 例如,我使用以下值:

>>> pprint(form.form_values())
[('cboData', '8/30/2010'),
 ('txtPlecare', 'Bucuresti Nord'),
 ('txtSosire', 'Constanta'),
 ('tip', 'GO'),
 ('lng', '1')]

result = parse(submit_form(form)).getroot()

这是另一个表格的另一页。我试着这样做:

>>> page2=parse(result).getroot()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.6/site-packages/lxml/html/__init__.py", line 661, in parse
    return etree.parse(filename_or_url, parser, base_url=base_url, **kw)
  File "lxml.etree.pyx", line 2706, in lxml.etree.parse (src/lxml/lxml.etree.c:49945)
  File "parser.pxi", line 1525, in lxml.etree._parseDocument (src/lxml/lxml.etree.c:72026)
TypeError: cannot parse from 'HtmlElement'

如何从第二页解析表单?

1 回复 | 直到 14 年前

Johannes Charra 14 年前

这个 getroot 方法不会为您提供另一个“页面”,而是 lxml.html.HtmlElement

parse 这一次,你已经把你需要的一切都装进了房间 result

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

3 月前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

3 月前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

3 月前

user29715306 · from_users=和chats=电视节目中的差异

3 月前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

4 月前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

4 月前

prayner · 更新嵌套字典包含列表中的项

4 月前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

4 月前

Dave · 如何在for循环中修改列表值

4 月前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

4 月前