HTML 中文亂碼

 在網頁中,中文亂碼的問題時常出現。之前我遇到亂碼問題時,就是不停的嘗試不一樣的編碼方式,直到成功。昨天項目又遇到了這個問題,我因而作了簡單的測試。html

    html文件是有編碼方式的,好比"UTF-8"、"GBK"等等。這些在記事本中或許看不出來,可是在eclipse中,能夠設置html文件的編碼方式,如下的圖片中會有說明。瀏覽器

    測試一:eclipse

    以"UTF-8"方式保存html文件,具體的文件內容見下圖:編輯器

    圖中能夠看到,文件的編碼方式爲"UTF-8",下方的紅框中的Other所示,是在eclipse中設置的。圖片上方的紅框指明瀏覽器打開該文件的編碼方式,能夠看到爲"UTF-8"。測試

    使用IE打開該文件,能夠看到下圖:編碼

    查看瀏覽器的編碼方式,能夠看到瀏覽器自動選擇了"UTF-8"方式,而且沒有出現亂碼。spa

    切換瀏覽器的編碼方式到"GB2312",能夠看到下圖:htm

        測試二圖片

        以"UTF-8"方式保存html文件,並設置文件頭中的編碼方式爲"GBK",以下圖:ip

    這代表:文件的編碼方式爲"UTF-8",默認的文件打開方式爲"GBK"。

    使用IE打開這個文件的截圖以下:

    能夠看到瀏覽器根據html文件的指示,用"GB2312"方式來打開。因爲文件自己的編碼方式是"UTF-8",因此出現了亂碼。可是網頁源文件並非亂碼。

    選擇瀏覽器的編碼方式爲"UTF-8",能夠看到亂碼現象消失。截圖以下:

    至此,測試結束。概括如下幾點:

    1.  html文件是有編碼格式的,這個在特定的編輯器中才能看出來,並進行設置。

    2.  html文件中頭部的"content-type"中設置的"charset"是告訴瀏覽器打開該文件的編碼方式。

    3.  通常一、2點中的編碼方式應該一致,不一致可能出現亂碼。

    4.  若是瀏覽器中顯示亂碼,可是頁面源文件不是亂碼,能夠經過修改瀏覽器的編碼方式看到正確的中文,若是在源文件中設置了正確的"charset",就不須要修改瀏覽器的編碼方式了。

相關文章
相關標籤/搜索