網站中文存到數據庫亂碼

首先檢查數據從哪裏開始亂碼 能夠用debug來看html

要把數據庫的字符集和網頁的字符集設置成同樣的如utf-8java

另外要選post方法傳送mysql

 


你數據庫,頁面,數據庫鏈接都是什麼編碼?
只要這三種都統一就不會亂碼!sql

 我整理的關於亂碼的問題,但願對你有幫助:
在提交JSP時對於亂碼問題,首先咱們要搞清楚爲何會出現亂碼?
看JSP的頭文件:<%@ page contentType="text/html;charset=UTF-8" language="java"%>
在這個頭文件中,還有一個與編碼的相關的屬性:pageEncoding
-----------------------------------------------------------------------------------------
首先,說說JSP/Servlet中的幾個編碼的做用。     
在JSP/Servlet中主要有如下幾個地方能夠設置編碼,pageEncoding="UTF-8"、contentType="text /html;charset=UTF-8"、request.setCharacterEncoding("UTF-8") 和 response.setCharacterEncoding("UTF-8"),其中前兩個只能用於JSP中,然後兩個能夠用於JSP和 Servlet 中。
-----------------------------------------------------------------------------------------
request.setCharacterEncoding("UTF-8")的做用是在服務器端設置客戶端請求進行從新編碼的編碼。    
      該方法用來指定對瀏覽器發送來的數據進行從新編碼(或者稱爲解碼)時,使用的編碼。     
response.setCharacterEncoding("UTF-8")的做用是指定在客戶端對服務器響應進行從新編碼的編碼。     
      服務器在將數據發送到瀏覽器前,對數據進行從新編碼時,使用的就是該編碼。
-----------------------------------------------------------------------------------------
1、瀏覽器是怎麼樣對接收和發送的數據進行編碼的 
1.瀏覽器接受數據:
    response.setCharacterEncoding("UTF- 8")的做用是指定對服務器響應進行從新編碼的編碼。同時,瀏覽器也 是根據這個參數來對其接收到的數據進行從新編碼(或者稱爲解碼)。因此在不管你在 JSP中設置 response.setCharacterEncoding("UTF-8")或 者 response.setCharacterEncoding("GBK"),瀏覽器均能正確顯示中文。
    讀者能夠作個實驗,在JSP中設置response.setCharacterEncoding("UTF-8"),在IE中顯示該頁面時,在 IE的菜單中選擇"查看(V)"à"編碼(D)"中能夠查看到是" Unicode(UTF-8)",而在在JSP中設置 response.setCharacterEncoding("GBK"),在IE中顯示該頁面 時,在IE的菜單中選擇"查看(V)"à"編碼 (D)"中能夠查看到是"簡體中文(GB2312)"。
2.瀏覽器發送數據:
     瀏覽器在發送數據時,對URL和參數會進行URL編碼,對參數中的中文,瀏覽器也是使 response.setCharacterEncoding參數來進行URL編碼的。以百度和 GOOGLE爲例,若是你在百度中搜索"漢字",百度會 將其編碼爲"%BA%BA%D7%D6"。而在GOOGLE中搜索"漢字",GOOGLE會將其編 碼爲"%E6%B1%89%E5%AD%97",這是 由於百度的response.setCharacterEncoding參數爲GBK,而 GOOGLE的的 response.setCharacterEncoding參數爲UTF-8。 
--------------------------------------------------------
2、服務器是在接收和發送數據時,是如何對數據進行編碼的
1.服務器發送數據
     對於發送數據,服務器按照response.setCharacterEncoding—contentType—pageEncoding的優先順序,對要發送的數據進行編碼。   
2.服務器接收數據
     對於接收數據,要分三種狀況。一種是瀏覽器直接用URL提交的數據,另外兩種是用表單的GET和POST方式提交的數據。     
     由於各類WEB服務器對這三種方式的處理也不相同,因此咱們以Tomcat5.0爲例。   
     ①對於表單中POST方式提交的數據
     只要在JSP頁面上設置了response.setCharacterEncoding或contentType或pageEncoding爲"utf-8",在接受數據的JSP/SERVLET中都不會出現中文亂碼問題。
     ②對於URL提交的數據和表單中GET方式提交的數據
     在接收數據的JSP/SERVLET中僅僅設置request.setCharacterEncoding參數是不行的
     由於在Tomcat5.0中,默認狀況下使用ISO-8859-1對URL提交的數據和表單中GET方式提交的數據進行從新編碼(解碼),要解決該問題:     
     應該在Tomcat的配置文件server.xml的Connector標籤中設置useBodyEncodingForURI或 者 URIEncoding屬性,其中URIEncoding參數指定對全部GET方式請求(包括URL提交的數據和表單中GET方式提交的數據)進行統 一的從新編碼(解碼)的編碼。
     其中useBodyEncodingForURI參數表示是否用request.setCharacterEncoding 參數對URL提交的數據和表單中GET方式提交的數據進行從新編碼,在默認狀況下,該參數爲false;
     URIEncoding和useBodyEncodingForURI區別是,URIEncoding是對全部GET方式的請求的數據進行統一 的從新編碼(解碼),而useBodyEncodingForURI則是根據響應該請求的頁面的 request.setCharacterEncoding參數對數據進行的從新編碼(解碼),不一樣的頁面能夠有不一樣的從新編碼(解碼)的編碼。因此對於 URL提交的數據和表單中GET方式提交的數據,能夠修改 URIEncoding參數爲瀏覽器編碼或者修改useBodyEncodingForURI 爲true,而且在得到數據的JSP頁面中 request.setCharacterEncoding參數設置成瀏覽器編碼。    
 ----------------------------------------------------------   
下面總結下,以Tomcat5.0爲WEB服務器時,如何防止中文亂碼。     
一、對於同一個應用,最好統一編碼,推薦爲UTF-8,固然GBK也能夠。     
二、正確設置JSP的pageEncoding="UTF-8" 
三、在全部的JSP/Servlet中設置contentType="text/html;charset=UTF-8"或response.setCharacterEncoding("UTF-8"),從而間接實現對瀏覽器編碼的設置。     
四、對於非表單提交的get或url請求,能夠修改Tomcat的默認配置,推薦將useBodyEncodingForURI參數設置爲true,也可 以將URIEncoding參數設置爲 UTF-8(有可能影響其餘應用,因此不推薦)。或者用下面的方法,在接收數據時處理:
  request.getParameter("userID"),獲得userID的值   
  request.getParameter("userID").trim()將這個值去掉兩邊的空格   
  request.getParameter("userID").trim().getBytes("ISO-8859-1"))將這個String用ISO-8859-1編碼成一個字節數祖   
  new   String(request.getParameter("userID").trim().getBytes("ISO- 8859-1"),"utf-8")將剛纔的字節數祖傳進string的構造函數按照"utf-8"編碼建立一個string對象。 
5.使用URLEncoder的方法
傳參前用: 
//使用指定的編碼機制將字符串轉換爲 application/x-www-form-urlencoded 格式
String username_encoder = URLEncoder.encode(username,"UTF-8");
接參數後顯示用:
//使用指定的編碼機制對 application/x-www-form-urlencoded 字符串解碼
String username_decoder = URLDecoder.decode(request.getParameter("username"),"UTF-8");
-----------------------------------------------------------------------------------------
什麼是"gbk"?什麼是"utf-8"?
1、字符上區分 
  GBK包含所有中文字符; 
  UTF-8則包含全世界全部國家須要用到的字符。
2、編碼上區分 
  GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準(好像還不是國家標準) 
  UTF-8編碼的文字能夠在各國各類支持UTF8字符集的瀏覽器上顯示。 
  例如,若是是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。因此,對於英文比較多的論壇 ,使用GBK則每一個字符佔用2個字節,而使用UTF-8英文卻只佔一個字節。
3、使用上區分 
  GBK是中國國家編碼,通用性比UTF8差,不過UTF8佔用的數據庫比GBK大,並且是通常作論壇的DZ這些程序,對應的組件和插件支持上GBK相應開發的比較全面點,再DIY的時候比較方便。 
  UTF8是國際編碼,它的通用性比較好,外國人也能夠瀏覽論壇,並且中文能夠直接識別,若是你的論壇要作的比較國際化那就必須用UTF8的。

  補充下:UTF8再繁體支持上比GBK有優點滴。 
  對於DZ論壇來講,不少插件都只支持GBK的,若是須要裝較多插件的論壇仍是用GBK比較好,而對裝較少插件且有特殊用戶羣的論壇用UTF8比較好。 
  因此,通常你要是作論壇只是國內的特定圈子裏的就用GBK簡單點,基本插件均可以安裝,可是若是你的站有國外的市場須要就建議UTF8了,

Web中文網站開發中,GBK與UTF-8是使用比較多的兩種字符集,但兩者是有區別的。總結以下。
1. GBK的文字編碼是雙字節來表示的,即不論中、英文字符均使用雙字節來表示,只不過爲區分中文,將其最高位都定成1。
   UTF-8編碼則是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24位(三個字節)來編碼。對於英文字符較多的論壇則用UTF-8節省空間。
2. GBK包含所有中文字符,包括簡體和繁體字
   UTF-8則包含全世界全部國家須要用到的字符。
3. GBK是在國家標準GB2312基礎上擴容後兼容GB2312的標準(好像還不是國家標準)
   UTF-8編碼的文字能夠在各國各類支持UTF8字符集的瀏覽器上顯示。
   好比,若是是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。 因此,對於英文比較多的論壇 ,使用GBK則每一個字符佔用2個字節,而使用UTF-8英文卻只佔一個字節。

請注意:
   UTF-8版本雖然具備良好的國際兼容性,但中文須要比GBK/BIG5版本多佔用50%的數據庫存儲空間,所以並不是推薦使用,僅供對國際兼容性有特殊要求的用戶使用。
簡單地說:
   對於中文較多的論壇,適宜用GBK編碼節省數據庫空間。
   對於英文較多的論壇,適宜用UTF-8節省數據庫空間。 數據庫

 

 

mysql設置瀏覽器

前一段時間,一直被mysql的字符集困擾,今天就這方面的知識總結一下.
MySQL的字符集支持(Character Set Support)有兩個方面:
     字符集(Character set)和排序方式(Collation)。
對於字符集的支持細化到四個層次:
     服務器(server),數據庫(database),數據表(table)和鏈接(connection)。


1.MySQL默認字符集服務器

  MySQL對於字符集的指定能夠細化到一個數據庫,一張表,一列,應該用什麼字符集。app

可是,傳統的 程序在建立數據庫和數據表時並無使用那麼複雜的配置,它們用的是默認的配置,那麼,默認的配置從何而來呢?函數

    (1)編譯MySQL 時,指定了一個默認的字符集,這個字符集是 latin1;
    (2)安裝MySQL 時,能夠在配置文件 (my.ini) 中指定一個默認的的字符集,若是沒指定,這個值繼承自編譯時指定的;
    (3)啓動mysqld 時,能夠在命令行參數中指定一個默認的的字符集,若是沒指定,這個值繼承自配置文件中的配置,此時 character_set_server 被設定爲這個默認的字符集;
    (4)當建立一個新的數據庫時,除非明確指定,這個數據庫的字符集被缺省設定爲character_set_server
    (5)當選定了一個數據庫時,character_set_database 被設定爲這個數據庫默認的字符集;
    (6)在這個數據庫裏建立一張表時,表默認的字符集被設定爲 character_set_database,也就是這個數據庫默認的字符集;
    (7)當在表內設置一欄時,除非明確指定,不然此欄缺省的字符集就是表默認的字符集;post

簡單的總結一下,若是什麼地方都不修改,那麼全部的數據庫的全部表的全部欄位的都用 latin1 存儲,不過咱們若是安裝 MySQL,通常都會選擇多語言支持,也就是說,安裝程序會自動在配置文件中把 default_character_set 設置爲 UTF-8,這保證了缺省狀況下,全部的數據庫的全部表的全部欄位的都用 UTF-8 存儲。


2.查看默認字符集(默認狀況下,mysql的字符集是latin1(ISO_8859_1)
一般,查看系統的字符集和排序方式的設定能夠經過下面的兩條命令:
     mysql> SHOW VARIABLES LIKE 'character%';
+--------------------------+---------------------------------+
| Variable_name            | Value                           |
+--------------------------+---------------------------------+
| character_set_client     | latin1                          |
| character_set_connection | latin1                          |
| character_set_database   | latin1                          |
| character_set_filesystem | binary                          |
| character_set_results    | latin1                          |
| character_set_server     | latin1                          |
| character_set_system     | utf8                            |
| character_sets_dir       | D:"mysql-5.0.37"share"charsets" |
+--------------------------+---------------------------------+

  mysql> SHOW VARIABLES LIKE 'collation_%';
+----------------------+-----------------+
| Variable_name        | Value           |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database   | utf8_general_ci |
| collation_server     | utf8_general_ci |
+----------------------+-----------------+

3.修改默認字符集
  (1) 最簡單的修改方法,就是修改mysql的my.ini文件中的字符集鍵值,
如    default-character-set = utf8
      character_set_server =  utf8
   修改完後,重啓mysql的服務,service mysql restart
   使用 mysql> SHOW VARIABLES LIKE 'character%';查看,發現數據庫編碼均已改爲utf8
+--------------------------+---------------------------------+
| Variable_name            | Value                           |
+--------------------------+---------------------------------+
| character_set_client     | utf8                            |
| character_set_connection | utf8                            |
| character_set_database   | utf8                            |
| character_set_filesystem | binary                          |
| character_set_results    | utf8                            |
| character_set_server     | utf8                            |
| character_set_system     | utf8                            |
| character_sets_dir       | D:"mysql-5.0.37"share"charsets" |
+--------------------------+---------------------------------+

   (2) 還有一種修改字符集的方法,就是使用mysql的命令
     mysql> SET character_set_client = utf8 ;
     mysql> SET character_set_connection = utf8 ;
     mysql> SET character_set_database = utf8 ;
     mysql> SET character_set_results = utf8 ;
     mysql> SET character_set_server = utf8 ;

     mysql> SET collation_connection = utf8 ;
     mysql> SET collation_database = utf8 ;
     mysql> SET collation_server = utf8 ;


通常就算設置了表的默認字符集爲utf8而且經過UTF-8編碼發送查詢,你會發現存入數據庫的仍然是亂碼。問題就出在這個connection鏈接層上。解決方法是在發送查詢前執行一下下面這句:

SET NAMES 'utf8';

它至關於下面的三句指令: SET character_set_client = utf8; SET character_set_results = utf8; SET character_set_connection = utf8; 總結: 所以,使用什麼數據庫版本,不論是3.x,仍是4.0.x仍是4.1.x,其實對咱們來講不重要,重要的有二:   1) 正確的設定數據庫編碼.MySQL4.0如下版本的字符集老是默認ISO8859-1,MySQL4.1在安裝的時候會讓你選擇。若是你準備使用UTF- 8,那麼在建立數據庫的時候就要指定好UTF-8(建立好之後也能夠改,4.1以上版本還能夠單獨指定表的字符集)   2) 正確的設定數據庫connection編碼.設置好數據庫的編碼後,在鏈接數據庫時候,應該指定connection的編碼,好比使用jdbc鏈接時,指定鏈接爲utf8方式.

相關文章
相關標籤/搜索