代码之家  ›  专栏  ›  技术社区  ›  mowgli

删除emojis/unicode字符

  •  2
  • mowgli  · 技术社区  · 7 年前

    我的网站和数据库设置为utf-8和utf8mb4。

    在文本区域,当用户输入utf-8符号/emojis时,它是完美的。

    但在某些输入字段(名称、地址等)上,我想消除这些“有趣符号”的可能性,只处理基本文本和数字,包括丹麦字符______ _ _ _=,.:;!”#&等等。

    我该怎么办?

    是否有一些本机PHP函数可以去除unicode符号/字符,或者我必须为它查找/生成特定的regex函数?

    1 回复  |  直到 7 年前
        1
  •  4
  •   Stu Care    7 年前

    http://php.net/manual/en/function.mb-check-encoding.php

    function StripNonUTF($str){
      return preg_replace('/[^\pL\pM[:ascii:]]+/g', '', $str);
    }
    
    推荐文章