我试图只将内容与属性值匹配。例如,我有以下数据
<div id='cont'>blablabla</div>
<span class='cont newClass'>blablabla</div>
<someothertag name='cont'>blablabla</div>
从上面我想匹配包含attrValue的所有标记
cont
为了匹配我使用了regex的任何标签,如下所示
soup.find_all(re.compile(r'.*'),{"class":re.compile(r".*cont.*")}):
-------------- ------------------------
Match any tag match with the string cont
但是我不知道如何使属性名的regex意味着
class,id,name,etc.
如果我使用纯regex,它将不匹配值,如下所示
re.findall(r'<[^>]*cont[^>]*>.+?<\/\1>',str(soup))