如果我将此添加到脚本的开头:
$KCODE = 'UTF8' require 'jcode'
然后我可以遍历包含Unicode字符的单词的每个字符。想象一个包含umlauts或其他内容的单词,然后像这样迭代它们:
word.each_char do |c| # do something with c end
如果 c 是一个Unicode字符,我打印它的大小,它将是2个(由2个字符组成)。我怎样才能得到 C 代码?我是否可以使用一些公式,或者std lib中是否有可以做到这一点的东西?
c
C
应该是:
c.unpack('U*').first