|
|
1
1
嗯,我倾向于同意,对于HTMLParser来说,不包含将HTML实体引用转换为普通ASCII和/或其他字符的代码是一个可怕的疏忽。我认为,这是补救完全不同的工作在蟒蛇3。 不过,我们似乎可以编写一个相当简单的实体处理程序,如:
... 不过,我们应该包装以进行进一步的输入验证,并在异常处理代码中包装整数转换。 但这应该能处理大约10行代码中的最小值。添加异常处理可能会使其行数加倍。 |
|
|
2
0
您需要实现自己的解析器还是已经创建了解析器?看看 beautiful soup . |