xml學習筆記之二

形式良好的 XML 文檔

「形式良好」或「結構良好」的 XML 文檔擁有正確的語法。ide

「形式良好」(Well Formed)的 XML 文檔會遵照前幾章介紹過的 XML 語法規則:spa

  • XML 文檔必須有根元素
  • XML 文檔必須有關閉標籤
  • XML 標籤對大小寫敏感
  • XML 元素必須被正確的嵌套
  • XML 屬性必須加引號

 

在 XML 中有 5 個預約義的實體引用:

&lt; < 小於
&gt; > 大於
&amp; & 和號
&apos; ' 省略號
&quot; " 引號

註釋:嚴格地講,在 XML 中僅有字符 "<"和"&" 是非法的。省略號、引號和大於號是合法的,可是把它們替換爲實體引用是個好的習慣。orm

 

CDATA

術語 CDATA 指的是不該由 XML 解析器進行解析的文本數據(Unparsed Character Data)。ip

在 XML 元素中,"<" 和 "&" 是非法的。文檔

"<" 會產生錯誤,由於解析器會把該字符解釋爲新元素的開始。字符串

"&" 也會產生錯誤,由於解析器會把該字符解釋爲字符實體的開始。it

某些文本,好比 JavaScript 代碼,包含大量 "<" 或 "&" 字符。爲了不錯誤,能夠將腳本代碼定義爲 CDATA。io

CDATA 部分中的全部內容都會被解析器忽略。table

CDATA 部分由 "<![CDATA[" 開始,由 "]]>" 結束:function

<script>
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
  {
  return 1;
  }
else
  {
  return 0;
  }
}
]]>
</script>

在上面的例子中,解析器會忽略 CDATA 部分中的全部內容。

關於 CDATA 部分的註釋:

CDATA 部分不能包含字符串 "]]>"。也不容許嵌套的 CDATA 部分。

標記 CDATA 部分結尾的 "]]>" 不能包含空格或折行。

相關文章
相關標籤/搜索