我的网站和数据库设置为utf-8和utf8mb4。
在文本区域,当用户输入utf-8符号/emojis时,它是完美的。
但在某些输入字段(名称、地址等)上,我想消除这些“有趣符号”的可能性,只处理基本文本和数字,包括丹麦字符______ _ _ _=,.:;!”#&等等。
我该怎么办?
是否有一些本机PHP函数可以去除unicode符号/字符,或者我必须为它查找/生成特定的regex函数?
http://php.net/manual/en/function.mb-check-encoding.php
function StripNonUTF($str){ return preg_replace('/[^\pL\pM[:ascii:]]+/g', '', $str); }