![]() |
1
4
鉴于您的文本似乎具有数字编码而非命名的实体,您可以首先将包含XML实体def(与号、哈希、数字、分号)的字节字符串转换为Unicode:
如果终端仿真器可以显示任意Unicode标志符号,则
在任何情况下,如果您愿意,现在可以使用您的原始re,您不会意外地“捕获”实体,只有ascii字母、数字和您列出的两个标点符号。(我不确定这是您真正想要的——例如,为什么不使用重音字母,而只使用ascii字母呢?--但是,如果 是 你想要什么,它会起作用的)。
如果你
做
除了数字编码的实体外,您还可以
也
应用
|
![]() |
2
1
您可以调整以下脚本:
在此处生成以下答案:
编辑:我把这个问题理解为“如何在进一步处理之前去掉html实体”,希望我没有浪费时间回答错误的问题;) |
![]() |
3
0
如果不知道这个短语是用来做什么的,我就不能确切地告诉你需要什么。 这将匹配特殊字符或字符串,不包括字母、数字、@和:
|