在網頁中,中文亂碼的問題時常出現。之前我遇到亂碼問題時,就是不停的嘗試不一樣的編碼方式,直到成功。昨天項目又遇到了這個問題,我因而作了簡單的測試。html
html文件是有編碼方式的,好比"UTF-8"、"GBK"等等。這些在記事本中或許看不出來,可是在eclipse中,能夠設置html文件的編碼方式,如下的圖片中會有說明。瀏覽器
測試一:eclipse
以"UTF-8"方式保存html文件,具體的文件內容見下圖:編輯器
圖中能夠看到,文件的編碼方式爲"UTF-8",下方的紅框中的Other所示,是在eclipse中設置的。圖片上方的紅框指明瀏覽器打開該文件的編碼方式,能夠看到爲"UTF-8"。測試
使用IE打開該文件,能夠看到下圖:編碼
查看瀏覽器的編碼方式,能夠看到瀏覽器自動選擇了"UTF-8"方式,而且沒有出現亂碼。spa
切換瀏覽器的編碼方式到"GB2312",能夠看到下圖:htm
測試二:圖片
以"UTF-8"方式保存html文件,並設置文件頭中的編碼方式爲"GBK",以下圖:ip
這代表:文件的編碼方式爲"UTF-8",默認的文件打開方式爲"GBK"。
使用IE打開這個文件的截圖以下:
能夠看到瀏覽器根據html文件的指示,用"GB2312"方式來打開。因爲文件自己的編碼方式是"UTF-8",因此出現了亂碼。可是網頁源文件並非亂碼。
選擇瀏覽器的編碼方式爲"UTF-8",能夠看到亂碼現象消失。截圖以下:
至此,測試結束。概括如下幾點:
1. html文件是有編碼格式的,這個在特定的編輯器中才能看出來,並進行設置。
2. html文件中頭部的"content-type"中設置的"charset"是告訴瀏覽器打開該文件的編碼方式。
3. 通常一、2點中的編碼方式應該一致,不一致可能出現亂碼。
4. 若是瀏覽器中顯示亂碼,可是頁面源文件不是亂碼,能夠經過修改瀏覽器的編碼方式看到正確的中文,若是在源文件中設置了正確的"charset",就不須要修改瀏覽器的編碼方式了。