c – 处理UTF-8字符串
|
据我所知,linux使用UTF-8编码. 现在在UTF-8上我们知道一些字符是1字节,一些2,3 ..字节. 特别是:如何获得字符串的长度(以字节为单位)(或字符数)?你将如何遍历字符串?等等 我问的原因是,正如我所说的UTF-8字符可能超过一个字节对吗? 如果要实际处理(而不是仅存储)Unicode字符,则需要在标准库外部进行冒险.传统上,这是由诸如ICU之类的库完成的. 然而,虽然这是一个成熟的库,但它的C接口很糟糕.在Ogonek中采用了一种现代化的方法.它并没有很好地建立并且仍在进行中,但提供了更好的界面. (编辑:安卓应用网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
