|
1
18
尝试 Jericho . 这个 TextExtractor 听上去这门课会满足你的要求。很抱歉,由于我是新用户,无法发布第二个链接,但向下滚动一点主页,就会有一个链接指向它。 |
|
2
3
HtmlUnit 它甚至在处理完javascript/ajax之后显示页面。 |
|
|
3
2
这个 bliki 发动机可以分两步完成此操作。见 info.bliki.wiki / Home
它将是大约7-8行代码,如下所示:
jsoup可以做得更简单:
但结果是您会丢失所有段落格式——不会有任何新行。 |
|
|
4
0
我用 TagSoup 它可用于多种语言,并对“在野外”找到的HTML做得非常好。它生成一个清理过的HTML或XML版本,然后您可以使用一些DOM/SAX解析器进行处理。 |
|
|
5
-1
我已经用过 Apache Commons Lang 换个方向。但看起来它可以通过 StringEscapeUtils . |
|
|
code-geek · Jquery根据单选按钮选择隐藏或显示文本字段 1 年前 |
|
|
Jamie · 在CSS链接的文件名中添加Jinja占位符 1 年前 |
|
ptownbro · 重叠分区标签,同时保持以下所有分区和内容就位 1 年前 |
|
|
john Rizzo · 按钮背景颜色、悬停和活动状态存在问题 1 年前 |