问题还原使用 erlang 存储一些特殊字符串到 MySQL 的时候,却没法读出来。经检查,这些字符串的二进制格式如下:
查看二进制的 unicode 是什么?
明显,1F606 和 1F610 超过了常见 unicode 字符串 0000-FFFF 的表达范围。
1F606 和 1F610 代表什么?根据 unicode 官网上的说明,这是一种 emoji(表情符号),具体的展示形式与厂商有关。
MySQL 上存储失败的原因目前来说,多数 MySQL 都是以 utf8 存储,注意 MySQL 的 utf8 和我们所说的传统 utf8 有点区别。MySQL 的 utf8 编码规定了最多只能有 3 个字节,而 emoji 的 unicode 已经超过了 3 个字节,因此 MySQL 的 utf8 无法识别与存储 emoji。 为此可以查阅 MySQL 中关于 unicode 支持的资料,从中可以得知 MySQL 在 5.5 后开始支持 utf8mb4,这种编码支持 1 ~ 4 个字节,这种编码可以表示 emoji。 另外 utf8mb4 向下兼容 utf8。
解决方案将 MySQL 中对应的字段改成 utf8mb4 编码:
参考:http://dev.mysql.com/doc/refman/5.5/en/charset-unicode-upgrading.html 将连接库的连接编码改为 utf8mb4,以 erlang 的连接库 emysql 为例:
为了建表方便,可以修改 my.cnf:
|
用户登录
还没有账号?立即注册
用户注册
投稿取消
| 文章分类: |
|
还能输入300字
上传中....