原文:http://blog.csdn.net/woslx/article/details/49685111java
utf-8編碼可能2個字節、3個字節、4個字節的字符,可是MySQL的utf8編碼只支持3字節的數據,而移動端的表情數據是4個字節的字符。若是直接往採用utf-8編碼的數據庫中插入表情數據,Java程序中將報SQL異常:mysql
java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x92\x94’ for column ‘name’ at row 1
at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1073)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3593)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3525)
at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:1986)
at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2140)
at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2620)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1662)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1581)sql
能夠對4字節的字符進行編碼存儲,而後取出來的時候,再進行解碼。可是這樣作會使得任何使用該字符的地方都要進行編碼與解碼。數據庫
utf8mb4編碼是utf8編碼的超集,兼容utf8,而且能存儲4字節的表情字符。
採用utf8mb4編碼的好處是:存儲與獲取數據的時候,不用再考慮表情字符的編碼與解碼問題。windows
更改數據庫的編碼爲utf8mb4:編碼
utf8mb4的最低mysql版本支持版本爲5.5.3+,若不是,請升級到較新版本。.net
5.1.34可用,最低不能低於5.1.13code
修改mysql配置文件my.cnf(windows爲my.ini)
my.cnf通常在etc/mysql/my.cnf位置。找到後請在如下三部分裏添加以下內容:
[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'server
SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';blog
Variable_name | Value |
---|---|
character_set_client | utf8mb4 |
character_set_connection | utf8mb4 |
character_set_database | utf8mb4 |
character_set_filesystem | binary |
character_set_results | utf8mb4 |
character_set_server | utf8mb4 |
character_set_system | utf8 |
collation_connection | utf8mb4_unicode_ci |
collation_database | utf8mb4_unicode_ci |
collation_server | utf8mb4_unicode_ci |
collation_connection 、collation_database 、collation_server是什麼不要緊。
但必須保證
系統變量 | 描述 |
---|---|
character_set_client | (客戶端來源數據使用的字符集) |
character_set_connection | (鏈接層字符集) |
character_set_database | (當前選中數據庫的默認字符集) |
character_set_results | (查詢結果字符集) |
character_set_server | (默認的內部操做字符集) |
這幾個變量必須是utf8mb4。
數據庫鏈接參數中:
characterEncoding=utf8會被自動識別爲utf8mb4,也能夠不加這個參數,會自動檢測。
而autoReconnect=true是必須加上的。
更改數據庫編碼:ALTER DATABASE caitu99 CHARACTER SET utf8mb4
COLLATE utf8mb4_general_ci
;
更改表編碼:ALTER TABLE TABLE_NAME
CONVERT TO CHARACTER SET utf8mb4
COLLATEutf8mb4_general_ci
; 若有必要,還能夠更改列的編碼