在數據庫中,字符亂碼屬於常見、多發問題。鑑於本人水平頂多只能歸於不入流之類,寫這篇文章時心裏坐臥不安,實在擔憂誤導你們。內容僅供參考,如有錯誤,請各位及時指出,我也好學習提升!mysql
MySQL的字符集有4種級別的設置,分別是:服務器級、數據庫級、表級、字段級。sql
(1)、能夠在my.cnf中設置數據庫
[mysqld] default-character-set=gbk (5.1) character-set-server=gbk (5.5)
(2)、能夠在啓動選項中設置服務器
mysqld --default-character-set=gbk
(3)、能夠在編譯的時候設置學習
./configure --with-charset=gbk 或 cmake . -default-charset=gbk
若是沒有指定服務器的字符集,默認使用latin1爲服務器的字符集。spa
(4)、查看當前服務器的字符集server
mysql> show variables like '%char%'; +--------------------------+-----------------------------------------+ | Variable_name | Value | +--------------------------+-----------------------------------------+ | character_set_client | latin1 | | character_set_connection | latin1 | | character_set_database | latin1 | | character_set_filesystem | binary | | character_set_results | latin1 | | character_set_server | latin1 | | character_set_system | utf8 | | character_sets_dir | /usr/local/mysql-5.6.28/share/charsets/ | +--------------------------+-----------------------------------------+
數據庫的字符集在建立數據庫的時候指定,也能夠在建立完數據庫以後經過alter database語句修改。若是數據庫中已經存在數據,修改數據庫字符集並不能將已有的數據按新字符集存放。因此沒法經過修改數據庫字符集修改數據的內容。對象
設置數據庫字符集的規則:blog
(1)、若是指定了字符集和校對規則,則使用指定的規則;string
(2)、若是僅指定字符集而沒有指定校對規則,則使用指定的字符集和默認的校對規則;
(3)、若是沒有指定字符集和校對規則,則使用服務器的字符集和校對規;
表的字符集是在建表的時候指定的,能夠經過alter table語句進行修改。一樣,對於表中已經存在的數據,修改字符集不會影響原有的記錄,仍將使用原有的字符集。
設置表的字符集的規則同設置數據庫的字符集規則。
列的字符集和校對規則能夠在建表的時候指定,也能夠在修改表的時候調整。(這個不經常使用,僅記錄一下)
除了上述的四種字符集外,對實際的應用訪問來講,還存在客戶端和服務端之間交互的字符集,以下:
(1)、character_set_client:客戶端字符集
(2)、character_set_connection:鏈接字符集
(3)、character_set_resluts:結果字符集
一般狀況下,這3個字符集都應該是相同的,才能保證用戶寫入的數據被正確的讀出,特別是對於中文字符。
set names命令則用於同時修改這3個參數的值。
字符集不一致是致使數據庫內中文內容亂碼的罪魁禍首。
實驗環境:
Server version: 5.6.28 (在此說明實驗環境是因爲在學習過程當中,從網上參考了部分資料,實驗過程與資料描述稍有出入,未查出緣由,只能暫歸結爲版本不一樣所致。)
實驗對象:
mysql> show create table char_test\G *************************** 1. row *************************** Table: char_test Create Table: CREATE TABLE `char_test` ( `id` smallint(6) NOT NULL AUTO_INCREMENT, `name` char(20) NOT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=latin1 1 row in set (0.00 sec)
由上可知,char_test表的字符集是latin1,若是不設置正確的字符集,插入中文字符時,必然會出現以下錯誤:
mysql> insert into char_test (name) values ('小王'); ERROR 1366 (HY000): Incorrect string value: '\xE5\xB0\x8F\xE7\x8E\x8B' for column 'name' at row 1
解決方案
(1)、先set names latin1,而後再插入數據。
mysql> set names latin1; Query OK, 0 rows affected (0.00 sec) mysql> insert into char_test (name) values ('小王'); Query OK, 1 row affected (0.01 sec) mysql> select * from char_test; +----+--------+ | id | name | +----+--------+ | 1 | Tom | | 2 | 小明 | | 3 | 小王 | +----+--------+ 3 rows in set (0.00 sec)
(2)、在data.sql文件中指定set names latin1,而後經過source命令導入data.sql。
# vi data.sql set names latin1; insert into char_test (name) values ('小李'); mysql> source data.sql Query OK, 1 row affected (0.00 sec) mysql> select * from char_test; +----+--------+ | id | name | +----+--------+ | 1 | Tom | | 2 | 小明 | | 3 | 小王 | | 4 | 小李 | +----+--------+ 4 rows in set (0.00 sec)
(3)、在data.sql文件中指定set names latin1,而後經過mysql命令導入
# vi data.sql set names latin1; insert into char_test (name) values ('小張'); # mysql -uroot -p test1 < data.sql
# mysql -uroot -p -e "set names latin1;select * from test1.char_test;"
(4)、經過指定mysql命令的字符集參數實現 --default-charset-set=字符集
# vi data.sql insert into char_test (name) values ('小張'); # 錯誤方法 # mysql -uroot -p test1 < data.sql Enter password: ****** ERROR 1366 (HY000) at line 1: Incorrect string value: '\xE5\xB0\x8F\xE8\xB5\xB5' for column 'name' at row 1 # 正確方法 # mysql -uroot -p --default-character-set=latin1 test1 < data.sql Enter password: ****** # mysql -uroot -p -e "set names latin1;select * from test1.char_test;" Enter password: ****** +----+--------+ | id | name | +----+--------+ | 1 | Tom | | 2 | 小明 | | 3 | 小王 | | 4 | 小李 | | 5 | 小張 | | 6 | 小趙 | +----+--------+
(5)、在配置文件中指定客戶端的字符集
vi my.cnf [client] default-character-set=latin1 mysql> insert into char_test (name) values ('小馬'); Query OK, 1 row affected (0.00 sec) mysql> select * from char_test; +----+--------+ | id | name | +----+--------+ | 1 | Tom | | 2 | 小明 | | 3 | 小王 | | 4 | 小李 | | 5 | 小張 | | 6 | 小趙 | | 7 | 小馬 | +----+--------+ 7 rows in set (0.00 sec)