1、字符集java
1.mysql的字符集設置很是靈活mysql
能夠設置服務器默認字符集;sql
數據庫默認字符集;數據庫
表默認字符集;服務器
列字符集;測試
若是某一級別沒有指定字符集,則繼承上一級。編碼
查看全部字符集語句:show character set;spa
2.以表聲明爲utf-8爲例,最終存儲在表中的數據爲utf-8blog
①咱們要告訴服務器,我給你發送的數據是什麼編碼?character_set_client排序
②告訴字符集轉換器,轉換成什麼編碼?character_set_connection
③查詢的結果用什麼編碼?character_set_results
若是以上三者都爲字符集N,可簡寫爲set names N;
3.什麼狀況下會出現亂碼呢?
咱們首先建立一個測試表指定表的字符集爲utf8
create table temp(
name varchar(10)
) charset utf8; //charset utf8;決定了服務器的編碼
而後執行這三條命令:
set character_set_client=gbk;
set character_set_connection=gbk;
set_character_set_results=gbk; 這三句能夠簡寫爲set names gbk;
最後往表裏插入一條數據:
insert into temp values('中國');
select * from temp;這時候顯示的結果是正常的。
當咱們再執行這句命令時:set character_results=utf8;
出現亂碼了,如圖:
由此可得出當返回的結果result的字符集與客戶端的字符集不符的時候會出現亂碼。
還有一種狀況也會出現亂碼:client聲明與事實不符時,你客戶端明明是utf8,你卻非要叫我轉成gbk的,以下圖:
可能還有不少種狀況,這裏沒有一一列舉。
4.什麼狀況下會形成數據的丟失呢?
執行這三條語句:
set character_set_client=gbk;
set character_set_connection=latin1;
set character_set_results=gbk;
再往表裏插入一條數據:insert into temp values('美國');
最後查詢的時候結果以下圖:
數據丟失了。
由此可得出當connection和服務器的字符集比client小時,會形成數據的丟失,可能用語不是很準確,可是能理解便可以了。我的理解,就跟java裏面不一樣數據類型相互轉換時同樣,好比把double類型強制轉換成int類型,就會形成精度的丟失同樣。
。。。。。。
ag:
舊服務器,相似於谷歌等,服務器使用的編碼是gbk或者是gb2312 ,如今開發的頁面使用的都是utf8,如何才能保證數據的不丟失
解決:其中connection能夠設置爲gbk或者utf8均可以
2、校對集
若是有a B c D按照asc排序,此時默認排序後的結果仍是a B c D ,並非按照ASCII排序的
什麼是校對集?
校對集:指字符集的排序規則。
查看全部校對集語句:show collation;
一種字符集能夠有一個或多個排序規則。
show collation like 'utf8%';將顯示全部關於utf8的校對集
以utf8爲例,默認是使用utf8_general_ci校對集,也能夠按二進制來排,utf8_bin
怎樣聲明校對集?
create table tableName
(
...
)charset utf8 collate utf8_general_ci;
注意:聲明的校對集必須是字符集合法的校對集。好比你字符集是utf8,你不能聲明gbk的校對集。