![]() |
1
5
一般来说,使用
仅供参考,
|
![]() |
2
6
|
![]() |
3
3
似乎使用“lxml”html5lib
|
|
4
1
首先,您需要html5lib,还必须安装lxml。虽然html5lib已经准备好使用lxml(以及其他一些库),但这两个库并没有打包在一起。[对于Windows用户来说,尽管我不喜欢对Win依赖项大惊小怪,因为我通常通过在项目所在的同一目录中制作副本来获取库,但我强烈建议使用pip;非常简单;我认为您需要管理员访问权限。] 然后你需要这样写:
那就好好享受你的靓汤吧! 注意解析器上的namespaceHTMLElements=false选项。这一点很重要,因为lxml是针对XML的,而不仅仅是HTML。因此,它会将它提供的所有标记标记为属于HTML名称空间。标签看起来像(例如)
而美团也不会很好的运作。 |
![]() |
5
0
尝试:
必须指定名称空间而不是名称空间前缀(
|