代码之家  ›  专栏  ›  技术社区  ›  Roy Tang

修剪HTML内容中的空白?

  •  0
  • Roy Tang  · 技术社区  · 16 年前

    我有一个CRUD维护屏幕,上面有一个自定义富文本编辑器控件(实际上是FCKEditor),程序从控件中提取格式化文本作为HTML保存到数据库。然而,我们的部分标准是,在保存之前,需要从内容中删除前导和尾随空格,所以我必须删除多余的&nbsp;以及<br>并且从HTML字符串的开头和结尾开始。

    我可以选择在客户端(使用Javascript)或服务器端(使用Java)执行此操作。是否有一种简单的方法,使用正则表达式或其他方法?我不确定它需要有多复杂,我需要能够删除以下内容:

    <p><br /> &nbsp;</p>
    

    然而,如果中间有任何有意义的文本,请保留它。(以上代码片段来自测试人员保存的实际HTML数据)

    1 回复  |  直到 16 年前
        1
  •  2
  •   James    16 年前
    /<p>(?:<br\s*\/>|&[#\w]{2,6};|[\s\n\r])*?<\/p>/g
    

    这应该匹配所有不包含任何“有意义的文本”的段落。