代码之家  ›  专栏  ›  技术社区  ›  Adriano Varoli Piazza

如何在插入表单时删除Word标记垃圾?

  •  4
  • Adriano Varoli Piazza  · 技术社区  · 16 年前

    我正在用PHP构建一个CMS,我担心的是用户必须从现有的Word(和Excel)文档中填充数据。现在,我已经看到了当他们不小心从Word复制粘贴到文本区域时会发生什么:数据库中充满了垃圾标记。

    现在,我当然可以自己去掉所有的标记,但是我必须首先开始学习它。所以我问你:你有没有测试过一些功能——一些常见嫌疑犯的插件(Tinymce,fckeditor,等等)对这里有帮助?对侵入性最小的解决方案的奖励。

    4 回复  |  直到 16 年前
        1
  •  4
  •   Zhaph - Ben Duguid    16 年前

    遗憾的是,我使用的大多数HTML编辑器控件都是:

    1. 有一个按钮可以删除标记的各种元素(字、HTML、脚本等)
    2. 剥去 全部的 通过javascript粘贴标记。

    如果你把它放在一个按钮上,那么一般来说,非技术用户会忘记按它,因为他们(有些人会说“不必”)不关心它:(

    稍微玩弄一下正则表达式(现在有了另一个问题;)就可以做一些类似于2的事情,但只针对Word XML。

        2
  •  3
  •   ayaz    16 年前

    我发现fckeditor可以处理从Word文档中猛拉并抛出的文本,这比tinymce要好得多。

        3
  •  2
  •   Adriano Varoli Piazza    16 年前

    好的,我找到了 a plugin for TinyMCE 这显然是我想要的。不过,这要求用户按一个按钮来粘贴,这比理想情况要差一点。有更好的吗?

        4
  •  0
  •   Paul Nearney    16 年前

    ASP.NET? Telerik RadEditor 为我工作得很好