mysql操做命令梳理(4)-中文亂碼問題

 

在平時的mysql運維操做中,常常會碰到插入中文字段後出現亂碼的狀況,產生中文亂碼的緣由通常有:
1)mysql的編碼格式不對,是latin1編碼。強烈推薦將mysql下的編碼格式都改成utf8,由於它兼容世界上全部字符!
2)mysql的表的語系設定問題(包含character與collation)
3)客戶端程式(例如php)的連線語系設定問題php

下面就對Mysql下處理數據表中中文字段亂碼問題的操做作一記錄:
爲了防止後續操做出現亂碼現象,最好在建立庫或數據表的時候就設置正確的編碼。
    建立數據庫的時候,設置編碼格式mysql

mysql> CREATE DATABASE hqsb 
    -> CHARACTER SET utf8 
    -> COLLATE utf8_general_ci;  
Query OK, 1 row affected (0.01 sec)

    建立表的時候,設置編碼格式sql

mysql> use hqsb;
Database changed
mysql>   CREATE TABLE haha (                                                                                                                   
    ->   id int(10) PRIMARY KEY AUTO_INCREMENT,
    ->   name varchar(64) NOT NULL
    ->   ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
Query OK, 0 rows affected (0.02 sec)

這3個設置好了,基本就不會出問題了,即建庫和建表時都使用相同的編碼格式。shell

若是在建庫建表的時候沒有指明編碼格式致使中文亂碼,能夠經過如下方式進行查詢。
1)查看mysql系統默認的編碼格式(保證下面查詢結果中的全部編碼格式都是utf8,有不是的就手動修改!):
a)session範圍(臨時修改,當前窗口有效)
查看數據庫編碼 數據庫

mysql> show variables like "%char%";  
+--------------------------+----------------------------------+
| Variable_name            | Value                            |
+--------------------------+----------------------------------+
| character_set_client     | gbk                             |
| character_set_connection | gbk                              |
| character_set_database   | utf8                             |
| character_set_filesystem | binary                           |
| character_set_results    | gbk                              |
| character_set_server     | utf8                             |
| character_set_system     | utf8                             |
| character_sets_dir       | /usr/local/mysql/share/charsets/ |
+--------------------------+----------------------------------+
8 rows in set (0.01 sec)

手動修改字符集(如上,哪一項不是utf8,就修改哪一項):bash

mysql> SET character_set_filesystem='utf8';  
Query OK, 0 rows affected (0.00 sec)

再次查看是否已修改:session

mysql> show variables like "%char%";  
+--------------------------+----------------------------------+
| Variable_name            | Value                            |
+--------------------------+----------------------------------+
| character_set_client     | utf8                             |
| character_set_connection | utf8                             |
| character_set_database   | utf8                             |
| character_set_filesystem | utf8                           |
| character_set_results    | utf8                             |
| character_set_server     | utf8                             |
| character_set_system     | utf8                             |
| character_sets_dir       | /usr/local/mysql/share/charsets/ |
+--------------------------+----------------------------------+
8 rows in set (0.01 sec)

如上能夠看到字符集已經修改爲都是utf8了。可是這裏有一個問題,那就是從新打開一個命令窗口而後查看數據編碼就又出現上面非utf8的狀況。這就須要設置global範圍:
b)global範圍(臨時修改,跨窗口有效)
mysql 設置變量的範圍默認是 session 範圍。若是設置多個會話的字符集那麼須要設置 global 範圍:Set [global|session] variables …運維

mysql> set global character_set_filesystem='utf8';  
Query OK, 0 rows affected (0.00 sec)

mysql> show variables like "%char%";  
+--------------------------+----------------------------------+
| Variable_name            | Value                            |
+--------------------------+----------------------------------+
| character_set_client     | utf8                             |
| character_set_connection | utf8                             |
| character_set_database   | utf8                             |
| character_set_filesystem | utf8                           |
| character_set_results    | utf8                             |
| character_set_server     | utf8                             |
| character_set_system     | utf8                             |
| character_sets_dir       | /usr/local/mysql/share/charsets/ |
+--------------------------+----------------------------------+
8 rows in set (0.01 sec)

當跨會話查看mysql字符集都會看到都是utf8。若是覺得這樣就萬事大吉了的話,那麼就大錯特錯了。
c)設置數據全局範圍(全局修改,永久生效)
如上設置後,當數據庫重啓後,就會發現設置global範圍的值又變成latin1了!
修改 mysql 配置文件 /etc/my.cnf網站

[mysqld]
character-set-server=utf8 
[client]
default-character-set=utf8 
[mysql]
default-character-set=utf8

如上設置後,重啓 mysql 服務,就會發現它的字符集就徹底變成 utf8了。
不過須要請注意上面這幾個參數配置的位置,否則可能會啓動不起來 mysql 服務!
這樣,後續建立數據庫或表的時候不須要指定字符編碼,它默認就是 utf8!編碼

Mysql字符集修改的兩點總結:
- 直接在session級別設置mysql的字符編碼,這是治標不治本的方法;
- 要從源頭上解決這個問題。那就是修改 mysql 默認的配置文件,把它的字符集修改爲可以使用中文字符的UTF8才行!

2)查看數據庫(好比hqsb)的編碼格式:

mysql> show create database hqsb;
+----------+---------------------------------------------------------------+
| Database | Create Database                                               |
+----------+---------------------------------------------------------------+
| hqsb     | CREATE DATABASE `hqsb` /*!40100 DEFAULT CHARACTER SET utf8 */ |
+----------+---------------------------------------------------------------+
1 row in set (0.00 sec)

若是數據庫的編碼格式不正確,能夠手動修改:

mysql> ALTER DATABASE hqsb DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;  
Query OK, 1 row affected (0.01 sec)

3)查看數據表(好比haha)的編碼格式:

mysql> show create table haha;
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table                                                                                                                                           |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| haha  | CREATE TABLE `haha` (
  `id` int(10) NOT NULL AUTO_INCREMENT,
  `name` varchar(64) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)

若是數據表的編碼格式不正確,能夠手動修改:

mysql> ALTER TABLE haha DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; 
Query OK, 0 rows affected (0.01 sec)

注意:
在客戶端(好比xshell)裏鏈接mysql插入數據,最好事先確保編碼格式爲Utf-8。

關於網頁中亂碼問題的幾點解決辦法總結

1)將網站編碼設爲utf-8。
2)若是網站已運做了很久,並有不少舊數據,不能再更改簡體中文的設定,那麼建議將頁面的編碼設爲GBK。
GBK與GB2312的區別就在於:GBK能比GB2312顯示更多的字符,要顯示簡體碼的繁體字,就只能用GBK。
3)編輯/etc/my.cnf ,在[mysql]段加入default_character_set=utf8;
4)在編寫Connection URL時,加上?useUnicode=true&characterEncoding=utf-8參數;
5)在網頁代碼中加上一個"set names utf8"或者"set names gbk"的指令,告訴MySQL連線內容都要使用utf8或者gbk;
相關文章
相關標籤/搜索