代码之家  ›  专栏  ›  技术社区  ›  b.roth

将XML或HTML转换为wiki标记-您会选择什么方法?

  •  2
  • b.roth  · 技术社区  · 15 年前

    我需要转换HTML文档(从 DocBook XML文档)到wiki标记语言,特别是到 PM Wiki 标记语言。目标是在我们新创建的wiki中包含公司的应用程序操作指南。这意味着我实际上有两个选择:

    1. 将HTMLS(从DocBook XML生成)转换为wiki
    2. 将DocBook XML直接转换为wiki

    由于HTMLS是由DocBook-to-HTML转换器生成的,因此在HTML文档中定义标记的方式变化不大,只不过是文档的内容。

    我正在寻找一个可以自己快速实现的解决方案。每次创建新版本的应用程序操作指南时,我都必须进行一次转换。

    到目前为止我一直在想的解决方案:

    1. 使用基于正则表达式的Perl或PHP脚本将HTML转换为wiki。
    2. 将DocBook XML直接转换为wiki。因为它是XML,所以我可以用Java进行XML解析。这里的风险是我不熟悉DocBooks XML格式(就像我对HTML的熟悉一样),所以这需要一些时间来学习。

    你会为这项工作选择什么方法?

    更新:

    我刚试过一个叫做pmwiki的扩展名 ConvertHTML .它没有很好地工作,因为它没有转换HTML标记(例如,没有像在wiki中那样转换),正如其文档所说:

    pmwiki标记不支持所有HTML标记,因此无法进行100%转换。但是,pmwiki可以在编辑或保存文本时对其进行替换。converthtml实现了一套比较全面的规则,用于将HTML标记转换为wiki标记。

    3 回复  |  直到 13 年前
        1
  •  4
  •   uckelman    15 年前

    This 可能有用,尽管它从DocBook转换为Mediawiki,而不是PM wiki。

    有Perl模块可以将HTML转换为各种wiki方言: HTML::WikiConverter . 所以,如果你能把你的DocBook转换成HTML,那也可以。

        2
  •  1
  •   bastianneu    15 年前

    我用过 Digester 从一个简单的XML文件中生成Java对象,并通过Java修改它以满足我的需要。这是一个非常简单的工具。也许你想试试。为我工作

        3
  •  0
  •   gerardw    13 年前