代码之家  ›  专栏  ›  技术社区  ›  Cam

使用标准Linux工具链查找/替换HTMLEntities?

  •  9
  • Cam  · 技术社区  · 14 年前

    有没有一种方法可以使用标准的Linux工具链执行如下操作?

    例如,example.com/index.php上的源代码是:

    Hello, & world! "
    

    我怎么能做这样的事…

    curl -s http://example.com/index.php | htmlentities
    

    …打印以下内容:

    Hello, & world! "
    

    只使用标准的Linux工具链?

    2 回复  |  直到 14 年前
        1
  •  18
  •   David Z    14 年前

    使用 recode .

    $ echo 'Hello, & world! "' | recode HTML_4.0
    Hello, & world! "
    

    编辑 顺便说一下, 重新编码 针对不同版本的HTML和XML提供了几种不同的转换,因此您可以使用例如 HTML_3.2 而不是 HTML_4.0 如果您有一个非常老的HTML文档。运行 recode -l 将列出程序支持的所有字符集的完整列表。

        2
  •  5
  •   Maryam    14 年前
    alias decode="php -r 'echo html_entity_decode(fgets( STDIN ));'"
    
    $ echo 'Hello, & world! "' | decode
    Hello, & world! "