|
|
1
9
你真的需要 HTML parser 为此 |
|
|
2
6
不要使用regex解析HTML。考虑使用 HTML Agility Pack . |
|
|
3
2
有一些可能性: 正则表达式 -快速但不可靠,它不能处理格式错误的HTML。 HTMG -很好,但是有很多内存泄漏。如果你想处理一些文件,没有问题。 SGMLRead -很好,但有个问题。有时它找不到默认的名称空间来获取其他节点,那么就不可能解析HTML。 http://developer.mindtouch.com/SgmlReader 雄伟-12 -很好,但不如sgmlreader快。 http://www.majestic12.co.uk/projects/html_parser.php sgmlreader(vb.net)示例
在Majestic-12中,不同的是,您必须使用“Next”命令步行到每个标签。您可以使用DLL找到一个示例代码。 |
|
|
4
1
正如其他人提到的,使用htmlagilityPack。但是,如果您喜欢jquery/css选择器,我刚刚找到了一个名为fizzler的htmlagilityPack的分支:
http://code.google.com/p/fizzler/
用这个你可以找到所有
或者找到一个特定的类
再简单不过了! |
|
|
A B · C#Excel自动调整列避免长文本时出错 8 月前 |
|
|
Megrez7 · C#ToArray转换合并为一行,导致数组元素更改 8 月前 |
|
Aycon · 在工厂方法中释放部分创建的对象的正确方法是什么? 8 月前 |
|
|
Sei · Avalonia/WPF将路由器传递到控制模板 9 月前 |