代码之家 › 专栏 › 技术社区 › jahmax

如何在python中使用regex?

parsing regex xml python

-1

jahmax · 技术社区 · 14 年前

我正在尝试解析来自google suggest的关键字,这是url:

http://google.com/complete/search?output=toolbar&q=test

'|<CompleteSuggestion><suggestion data="(.*?)"/><num_queries int="(.*?)"/></CompleteSuggestion>|is'

我如何解析这些信息?我不想使用minidom,因为我认为regex的代码会更少。

2 回复 | 直到 14 年前

1

5

Marcelo Cantos 14 年前

你可以用 etree :

>>> from xml.etree.ElementTree import XMLParser
>>> x = XMLParser()
>>> x.feed('<toplevel><CompleteSuggestion><suggestion data=...')
>>> tree = x.close()
>>> [(e.find('suggestion').get('data'), int(e.find('num_queries').get('int')))
     for e in tree.findall('CompleteSuggestion')]
[('test internet speed', 31800000), ('test', 686000000), ...]

它比正则表达式更像代码,但它也做得更多。具体地说,它将一次性获取整个匹配列表,并在 data

2

2

Community CDub 8 年前

RegEx match open tags except XHTML self-contained tags

这是一个XML文档。请重新考虑XML解析器。它将更加健壮,最终可能花费更少的时间,即使它是更多的代码。

推荐文章

J_Cus504 · 在单匹配语句中使用身份变换和多谓词来沉默节点

4 月前

Rico Strydom · Linq to XML:如何基于文件中的其他元素获取元素

4 月前

surge3333 · 使用PowerShell构建XML

4 月前

Rashid Bilal · 主题更改时Android应用程序区域设置更改回英语

4 月前

Sandeep · XSLT代码,用于根据条件提取元素值

5 月前

Reto · XSLT 3.0突发流-如何存储/获取另一个分支的值

5 月前

ams_132 · 为什么这个youtube XML数据中的这些字段没有使用Rust中的quick XML正确反序列化

5 月前

SeveredTRUTH · 无法使用PowerShell从XML文件中的“Set”元素检索信息

5 月前

Maksym Kuzmych Yong Shun · 如何向XML属性添加命名空间前缀

6 月前

Ian Kemp · 如何从SelectXml调用本机XPath函数?

6 月前

关于移动版

代码之家 - 一站式码农服务社区

沪ICP备11025650号