【META http-equiv="Content-Type" Content="text/html; Charset=*】意義詳解

 

META http-equiv="Content-TypeContent="text/html; Charset=*】意義詳解

META,網頁Html語言裏Head區重要標籤之一
HTTP-EQUIV相似於HTTP的頭部協議,它迴應給瀏覽器一些有用的信息,以幫助正確和精確地顯示網頁內容。經常使用的HTTP- EQUIV類型有:

Content-Type和Content-Language (顯示字符集的設定)
說明:設定頁面使用的字符集,用以說明主頁製做所使用的文字已經語言,瀏覽器會根據此來調用相應的符集顯示page內容。
< Meta  http-equiv=" Content-TypeContent=" text/html; Charset=gb2312">該 META標籤訂義了HTML頁面所使用的字符集爲GB2132,就是國標漢字碼。若是將其中的「charset=GB2312」替換成「BIG5」,則該頁面所用的字符集就是繁體中文Big5碼。當你瀏覽一些國外的站點時,IE瀏覽器會提示你要正確顯示該頁面須要下載xx語支持。這個功能就是經過讀取HTML頁面 META標籤的 Content-Type屬性而得知須要使用哪一種字符集顯示該頁面的。若是系統裏沒有裝相應的字符集,則IE就提示下載。其餘的語言也對應不一樣的charset,好比日文的字符集是「iso-2022-jp 」,韓文的是「ks_c_5601」。
Content-TypeContent還能夠是: text/xml等文檔類型Charset選項:ISO-8859-1(英文)、BIG五、UTF-八、SHIFT-Jis、Euc、Koi8-二、us-ascii, x-mac-roman, iso-8859-2, x-mac-ce, iso-2022-jp, x-sjis, x-euc-jp,euc-kr, iso-2022-kr, gb2312, gb_2312-80, x-euc-tw, x-cns11643-1,x-cns11643-2等字符集;Content-Language的 Content還能夠是:EN、FR等語言代碼。 字符集與編碼 各個國家和地區所制定的不一樣 ANSI 編碼標準中,都只規定了各自語言所需的「字符」。好比:漢字標準(GB2312)中沒有規定韓國語字符怎樣存儲。這些 ANSI 編碼標準所規定的內容包含兩層含義: 1. 使用哪些字符。也就是說哪些漢字,字母和符號會被收入標準中。所包含「字符」的集合就叫作「字符集」。 2. 規定每一個「字符」分別用一個字節仍是多個字節存儲,用哪些字節來存儲,這個規定就叫作「編碼」。 各個國家和地區在制定編碼標準的時候,「字符的集合」和「編碼」通常都是同時制定的。所以,日常咱們所說的「字符集」,好比:GB2312, GBK, JIS 等,除了有「字符的集合」這層含義外,同時也包含了「編碼」的含義。 「UNICODE 字符集」包含了各類語言中使用到的全部「字符」。用來給 UNICODE 字符集編碼的標準有不少種,好比:UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等。 一、ISO-8859-1: 最簡單的編碼規則,每個字節直接做爲一個 UNICODE 字符。好比,[0xD6, 0xD0] 這兩個字節,經過 iso-8859-1 轉化爲字符串時,將直接獲得 [0x00D6, 0x00D0] 兩個 UNICODE 字符,即 "ÖÐ"。 反之,將 UNICODE 字符串經過 iso-8859-1 轉化爲字節串時,只能正常轉化 0~255 範圍的字符。 二、GB2312,BIG5,Shift_JIS,ISO-8859-2 把 UNICODE 字符串經過 ANSI 編碼轉化爲「字節串」時,根據各自編碼的規定,一個 UNICODE 字符可能轉化成一個字節或多個字節。 反之,將字節串轉化成字符串時,也可能多個字節轉化成一個字符。好比,[0xD6, 0xD0] 這兩個字節,經過 GB2312 轉化爲字符串時,將獲得 [0x4E2D] 一個字符,即 '中' 字。 「ANSI 編碼」的特色: 1. 這些「ANSI 編碼標準」都只能處理各自語言範圍以內的 UNICODE 字符。 2. 「UNICODE 字符」與「轉換出來的字節」之間的關係是人爲規定的。 三、UTF-8,UTF-16,UnicodeBig 與「ANSI 編碼」相似的,把字符串經過 UNICODE 編碼轉化成「字節串」時,一個 UNICODE 字符可能轉化成一個字節或多個字節。 與「ANSI 編碼」不一樣的是:
相關文章
相關標籤/搜索