![]() |
1
6
好吧,既然没人回答这个问题,我会自己试着回答的。 我编写了所有的开始/结束元素处理程序,看起来libxml不再创建dom了。返回的文档指针至少为空。它仍然坚持HTML和body元素,但我可以接受。 一个主要问题是libxml保留了所有的空白节点,不管是什么。所以我必须解析文本内容以消除可忽略的空白。它很难看,但很管用。我应该提到解析UTF-8是一种你很少错过的乐趣吗? 老实说,libxml文档非常糟糕。我建议任何一个尝试阅读文档的人:改为阅读源代码。代码的可读性和文档化程度更高。 谢谢关注。 |