|
|
1
2
如果您不知道原始字节的编码,则无法将其转换为已知形式。我为Unicode联盟写了一篇关于这个问题的论文。看见 Mapping Text in Unspecified Character Sets to Unicode as a Canonical Representation in a Hostile Environment 此代码 UTF-8可以支持全范围的Unicode字符(目前约为2^21)。拉丁语1只能支持2^8个字符。
|
|
|
2
-2
但这只是一个变通办法。之前应该做的是检查对数据库的访问,因为从数据库中选择数据时,数据应该以这种方式显示。作为第一个测试,使用一个普通的DB客户端,看看文本是否正确显示在其中。如果是这种情况,那么表正确地包含了数据,并且从数据库中检索数据时出现了问题。这可能是连接字符串中的字符集设置错误,或者您没有使用
试着找出这个问题的根源并加以解决。那么你不需要像上面那样的黑客来获得正确的数据。 |