代码之家 › 专栏 › 技术社区 › Pablo

firefox domparser问题

parsing dom firefox javascript

Pablo · 技术社区 · 15 年前

出于某种原因,domparser正在为每个换行添加一些额外的文本元素 \n 对于这个URL

…以及我尝试过的其他RSS。我查看了CNN/BBC的提要,它们没有新行,DOM解析器处理得很好。所以在分析之前我必须添加以下内容

var xmlText = htmlText.replace(/\n[ ]*/g, "");
var xmlDoc = parser.parseFromString(xmlText, "text/xml");

服务器正在返回文本/XML。

var channel = xmlDoc.documentElement.childNodes[0];

这种回归 \n 没有我上面的代码 channel 带修正。

3 回复 | 直到 15 年前

Dormilich 15 年前

出于某种原因,domparser正在为该URL的每个换行添加一些额外的文本元素。

这是标准行为。只有ie忽略元素节点之间的空格。( XML Whitespace Handling , Whitespace @ MSDN , Whitespace @ MDC )

bobince 15 年前

是的,这就是默认情况下XML解析器应该做的。习惯于遍历子节点,检查它们是否是元素( nodeType===1 )或文本节点( 3 )

从火狐3.5你可以 Element Traversal API 为您提供 firstElementChild 和 nextElementSibling . 这使得在忽略空白的同时遍历DOM变得更容易。或者可以使用xpath( doc.evaluate )找到你想要的元素。

如果您想永久地删除空白节点,最好在解析的DOM上执行,而不是使用regex hack:

function removeWhitespace(node) {
    for (var i= node.childNodes.length; i-->0;) {
        var child= node.childNodes[i];
        if (child.nodeType===3 && child.data.match(/^\s*$/))
            node.removeChild(child);
        if (child.nodeType===1)
            removeWhitespace(child);
    }
}

Delan Azabani 15 年前

你的问题是什么?你希望不使用变通方法?我认为解决方法是必要的,因为解析器按预期工作。

推荐文章

David542 · 任何语言都允许函数名中有空格吗?

11 月前

Abbey A. · 从中的文本字符串中有条件地解析数字,并将其分配给R中的新列

11 月前

David542 · 为什么词法分析器通常将var定义为不能以数字开头?

11 月前

thenightmarechild92 · 使用正则表达式拆分具有唯一标题的子节

1 年前

Andy · 将LENGTH OF移动到COMP字段解析失败

1 年前

Chris Geo · 如何找到LR0项目的FOLLOW集合?

1 年前

Anton · 不能将运算符[]与数组的字符串参数一起使用(解析json)

1 年前

user25485370 · 如何在带分隔符的C++中解析字符串?[关闭]

1 年前

Yash Singhal · 在reactjs中解析Pdf中的文本

1 年前

i33SoDA · 如何将逗号分隔的数字字符串解析为int数组?

1 年前