【META http-equiv="Content-Type" Content="text/html; Charset=*】意義詳解

時間 2019-12-11

標籤 meta http equiv content type text html charset 意義詳解欄目 HTML5 简体版

原文原文鏈接

【META http-equiv="Content-Type" Content="text/html; Charset=*】意義詳解

META，網頁Html語言裏Head區重要標籤之一
HTTP-EQUIV相似於HTTP的頭部協議，它迴應給瀏覽器一些有用的信息，以幫助正確和精確地顯示網頁內容。經常使用的HTTP- EQUIV類型有：

Content-Type和Content-Language (顯示字符集的設定)
說明：設定頁面使用的字符集，用以說明主頁製做所使用的文字已經語言，瀏覽器會根據此來調用相應的符集顯示page內容。
< Meta http-equiv=" Content-Type" Content=" text/html; Charset=gb2312">該 META標籤訂義了HTML頁面所使用的字符集爲GB2132，就是國標漢字碼。若是將其中的「charset=GB2312」替換成「BIG5」，則該頁面所用的字符集就是繁體中文Big5碼。當你瀏覽一些國外的站點時，IE瀏覽器會提示你要正確顯示該頁面須要下載xx語支持。這個功能就是經過讀取HTML頁面 META標籤的 Content-Type屬性而得知須要使用哪一種字符集顯示該頁面的。若是系統裏沒有裝相應的字符集，則IE就提示下載。其餘的語言也對應不一樣的charset，好比日文的字符集是「iso-2022-jp 」，韓文的是「ks_c_5601」。
Content-Type的 Content還能夠是： text/xml等文檔類型Charset選項：ISO-8859-1(英文)、BIG五、UTF-八、SHIFT-Jis、Euc、Koi8-二、us-ascii, x-mac-roman, iso-8859-2, x-mac-ce, iso-2022-jp, x-sjis, x-euc-jp,euc-kr, iso-2022-kr, gb2312, gb_2312-80, x-euc-tw, x-cns11643-1,x-cns11643-2等字符集；Content-Language的 Content還能夠是：EN、FR等語言代碼。字符集與編碼各個國家和地區所制定的不一樣 ANSI 編碼標準中，都只規定了各自語言所需的「字符」。好比：漢字標準（GB2312）中沒有規定韓國語字符怎樣存儲。這些 ANSI 編碼標準所規定的內容包含兩層含義： 1. 使用哪些字符。也就是說哪些漢字，字母和符號會被收入標準中。所包含「字符」的集合就叫作「字符集」。 2. 規定每一個「字符」分別用一個字節仍是多個字節存儲，用哪些字節來存儲，這個規定就叫作「編碼」。各個國家和地區在制定編碼標準的時候，「字符的集合」和「編碼」通常都是同時制定的。所以，日常咱們所說的「字符集」，好比：GB2312, GBK, JIS 等，除了有「字符的集合」這層含義外，同時也包含了「編碼」的含義。「UNICODE 字符集」包含了各類語言中使用到的全部「字符」。用來給 UNICODE 字符集編碼的標準有不少種，好比：UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等。一、ISO-8859-1：最簡單的編碼規則，每個字節直接做爲一個 UNICODE 字符。好比，[0xD6, 0xD0] 這兩個字節，經過 iso-8859-1 轉化爲字符串時，將直接獲得 [0x00D6, 0x00D0] 兩個 UNICODE 字符，即 "ÖÐ"。反之，將 UNICODE 字符串經過 iso-8859-1 轉化爲字節串時，只能正常轉化 0~255 範圍的字符。二、GB2312,BIG5,Shift_JIS,ISO-8859-2 把 UNICODE 字符串經過 ANSI 編碼轉化爲「字節串」時，根據各自編碼的規定，一個 UNICODE 字符可能轉化成一個字節或多個字節。反之，將字節串轉化成字符串時，也可能多個字節轉化成一個字符。好比，[0xD6, 0xD0] 這兩個字節，經過 GB2312 轉化爲字符串時，將獲得 [0x4E2D] 一個字符，即 '中' 字。「ANSI 編碼」的特色： 1. 這些「ANSI 編碼標準」都只能處理各自語言範圍以內的 UNICODE 字符。 2. 「UNICODE 字符」與「轉換出來的字節」之間的關係是人爲規定的。三、UTF-8,UTF-16,UnicodeBig 與「ANSI 編碼」相似的，把字符串經過 UNICODE 編碼轉化成「字節串」時，一個 UNICODE 字符可能轉化成一個字節或多個字節。與「ANSI 編碼」不一樣的是：

相關標籤/搜索

content

contenttype