一、什麼是xml、xml的做用css
二、xml的語法html
三、DTD約束xmlnode
四、Schema約束xmldom
五、DOM解析xmleclipse
在前面學習的html語言,html是超文本標記語言,使用html語言規定好的標籤來封裝文本數據。而html使用的標籤html語言規定好的,每一個標籤都有本身特定的功能。工具
xml語言,可擴展的標記語言,這門語言它沒有定義任何的標記,而標記是由使用者本身來定義,可是因爲標籤名稱以及屬性名稱都由用戶本身來命名,致使別人在使用的時候很不方便。有給xml語言定義了一些約束文檔,這些約束文檔就專門用來約束當前這個xml中可以書寫的具體的標籤以及屬性等信息。學習
xml做用: 一、存儲和傳輸複雜的關係模型數據 二、做爲配置文件存在,xml中主要配置的一些具備複雜的層級關係的數據,Properties文件中主要配置的一些key和value這樣的數據。 在軟件系統中,做爲配置文件使用 爲提升系統的靈活性,它所啓動的模塊一般由其配置文件決定 例如一個軟件在啓動時,它須要啓動A、B兩個模塊,而A、B這兩個模塊在啓動時,又分別須要A一、A2和B一、B2模塊的支持,爲了準確描述這種關係,此時使用XML文件最爲合適不過。 <soft> <A> <A1></A1> <A2></A2> </A> <B> <B1></B1> <B2></B2> </B> </soft>
來聲明當前的xml類型。 <?xml ?> 在這個尖括號中書寫標籤的屬性來聲明當前的xml類型限定。 屬性:版本號 字符編碼 是不是獨立存在的xml文檔 <?xml version=」1.0」 encoding=」編碼表」 standalone=」yes|no」 ?> 例如: <?xml version=」1.0」 encoding=」UTF-8」 ?> 在定義xml的文檔聲明時 <?之間不能有空白的內容 ?> 它們之間也不能有空格 中間書寫的屬性使用空格隔開。
xml中的標籤也分紅單標籤和雙標籤。注意在xml全部的標籤必須閉合。xml中的標籤區別大小寫。 <a1> <A1>表示2個不一樣的標籤。 xml中的標籤能夠嵌套,可是不能交差嵌套。 <a1><b1></b1></a1> <a1><b1></a1></b1> xml的標籤只能有一個根標籤。同時xml標籤中的空白內容也會被解析成文本內容。 <網址>www.itcast.cn</網址> 標籤不能以數字開始,不建議如下劃線開始,同時在標籤名中不要使用冒號。 標籤名能夠是中文,可是必定指定可以識別中文的碼錶。但不建議書寫中文。
在定義標籤的時候,能夠在標籤上書寫屬性,屬性是由key和alue值組成。屬性名書寫的時候也遵照標籤名的規則。屬性值也不能以數字開始。 屬性和值之間使用=鏈接,屬性值可使用單引號也可使用雙引號。 <user uid=」u001」 name=」zhang’san」></user> 另外:在xml技術中,標籤屬性所表明的信息,也能夠改成用子元素的形式來描述,如: <input><type>text</type></input>
xml中的註釋和html註釋相同。<!-- 這裏書寫具體的註釋內容 --> 在eclipse中可使用ctrl + shift + c 給每行添加註釋,也可使用ctrl + shift + / 添加註釋 ctrl + shift + \ 取消註釋 註釋不能加在聲明中及聲明前。
在編寫XML文件時,有些內容可能不想讓解析引擎解析執行,而是看成原始內容處理。 遇到此種狀況,能夠把這些內容放在CDATA區裏,對於CDATA區域內的內容,XML解析程序不會處理,而是直接原封不動的輸出。 語法:<![CDATA[ 內容 ]]> <![CDATA[ <itcast> <br/> </itcast> ]]> 對於一些單個字符,若想顯示其原始樣式,也可使用轉義的形式予以處理。
處理指令,簡稱PI (processing instruction)。處理指令用來指揮解析引擎如何解析XML文檔內容。 例如,在XML文檔中可使用xml-stylesheet指令,通知XML解析引擎,應用css文件顯示xml文檔內容。 <?xml-stylesheet type="text/css" href="1.css"?> 處理指令必須以「<?」做爲開頭,以「?>」做爲結尾,XML聲明語句就是最多見的一種處理指令。
全部xml元素必須有閉合標籤;
Xml標籤區分大小寫;
Xml必須正確地嵌套順序;
Xml文檔必須有根元素(且只有一個);
Xml屬性值須加引號
特殊字符必須轉義——CDATA;
Xml中的空格、回車換行會被解析!
因爲xml的標籤由用戶本身定義,所以在開發的時候,每一個人均可以根據本身的需求來定義xml標籤,這樣致使項目中的xml難以維護,所以須要使用必定的規範機制來約束xml文件中的標籤書寫。ui
第一步:先本身定義一個xml文件編碼
<?xml version="1.0" encoding="UTF-8"?> <users> <user> <name>zhangsan</name> <age>23</age> <addr>shanghai</addr> </user> <user> <name>lisi</name> <age>24</age> <addr>beijing</addr> </user> </users>
第二步:書寫DTD文件來約束xml文件spa
DTD文件在定義的時候,擴展名就是dtd。
在xml文件中有多少個標籤,就在dtd中書寫多少個ELEMENT標籤
<?xml version="1.0" encoding="UTF-8" ?> <!ELEMENT users (user+) > <!ELEMENT user (name,age,addr) > <!ELEMENT name (#PCDATA) > <!ELEMENT age (#PCDATA)> <!ELEMENT addr (#PCDATA)>
DTD主要用來約束xml文件,DTD能夠單獨寫在文件中,也能夠直接定義在xml中,能夠在xml中引入第三方的公共DTD。 外部DTD的引入方式:外部DTD主要指的一個獨立的DTD文件。 首先要書寫DTD文件,而後在要被約束的xml文件中引入。 <!DOCTYPE 文檔根結點 SYSTEM "DTD文件的URL"> 文檔根結點 指的是當前xml中的根標籤。 SYSTEM 引入的系統中存在文件 "DTD文件的URL" DTD存放的位置 引入公共的DTD: <!DOCTYPE 文檔根結點 PUBLIC "DTD名稱" "DTD文件的URL"> 文檔根結點 指的是當前xml中的根標籤。 PUBLIC 表示當前引入的DTD是公共的DTD 在xml中直接書寫DTD <!DOCTYPE 根標籤名 [ 具體的標籤的約束 ]>
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE users[ <!ELEMENT users (user+) > <!ELEMENT user (name,age,addr) > <!ELEMENT name (#PCDATA) > <!ELEMENT age (#PCDATA) > <!ELEMENT addr (#PCDATA) > ]> <users> <user> <name>zhangsan</name> <age>23</age> <addr>shanghai</addr> </user> <user> <name>lisi</name> <age>24</age> <addr>beijing</addr> </user> </users>
當定義DTD約束xml時候,這時須要在DTD中使用ELEMENT來定義當前xml中能夠出現的標籤名稱。 格式: <!ELEMENT 標籤名 約束> 約束來限定當前標籤中能夠有的子標籤,或者當前標籤中能夠書寫的內容 在定義標籤名的時候,約束中可使用一些符號標籤具體出現次數 ? 零次或者一次 * 零次或者屢次 + 一次或者屢次 users (user+) 表示當前的users標籤下能夠有一個或者多個user標籤 , 用來限定當前的子標籤出現的順序user (name,age,addr) user標籤下只能有name age addr 子標籤,而且必須按照name age addr的順序書寫 | user (name|age,addr) user下能夠name或者age ,但必須有addr,而且addr必須name或age後面 #PCDATA 代表該元素可包含任何字符數據,但不能在其中包含任何子元素。只有 PCDATA 的元素經過圓括號中的 #PCDATA 進行聲明 EMPTY 代表該元素不能有任何子元素或文本,僅可使用屬性。 ANY 表該元素中能夠包含任何DTD中定義的元素內容 如:<!ELEMENT note ANY> <!ELEMENT age EMPTY > 當前的age標籤是個空標籤,它不能有文本內容。
在xml中的標籤上是能夠書寫屬性的,在DTD中就須要對屬性進行約束。 格式: <!ATTLIST 標籤名 屬性名 屬性的類型 屬性的約束> 若是一個標籤上有多個屬性 <!ATTLIST 標籤名 屬性名 屬性的類型 屬性的約束 屬性名 屬性的類型 屬性的約束 屬性名 屬性的類型 屬性的約束 > <標籤名 屬性1=」」 屬性2=」」 屬性3=」」 >
屬性的類型:
CDATA 屬性的value值能夠是文本數據
(值1 | 值2 | 值3.... ) 表示當前的屬性的value值只能是當前括號中的值
ID 表示惟一。對當前標籤上的id屬性進行限定,而且同一個xml中id不能重複
類型 描述
CDATA 值爲字符數據 (character data)
(en1|en2|..) 此值是枚舉列表中的一個值
ID 值爲惟一的 id
IDREF 值爲另一個元素的 id
IDREFS 值爲其餘 id 的列表
NMTOKEN 值爲合法的 XML 名稱
NMTOKENS 值爲合法的 XML 名稱的列表
ENTITY 值是一個實體
ENTITIES 值是一個實體列表
NOTATION 此值是符號的名稱
xml: 值是一個預約義的 XML 值
屬性的約束: REQUIRED 屬性是必須書寫的 Implied 屬性是可選得 #fixed value 屬性的value是固定的值 「值」 表明屬性的默認值 user name CDATA fixed 「zhangsan」 <user name=」zhangsan」> user name CDATA 「張三」 <user />
屬性的類型和約束的組合:
CDATA REQUIRED
CDATA Implied
CDATA fixed
CDATA 「值」
(值1 | 值2 | 值3.... ) REQUIRED
ID REQUIRED
實體用於爲一段內容建立一個別名,之後在XML文檔中就可使用別名引用這段內容了。 在DTD定義中,一條<!ENTITY …>語句用於定義一個實體。 實體能夠理解成Java中預先定義好的一個常量,而後xml文件中就能夠引入當前這個定義的實體。
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE users[ <!ELEMENT users (user+) > <!ELEMENT user (name,age,addr) > <!ELEMENT name (#PCDATA) > <!ELEMENT age EMPTY > <!ELEMENT addr (#PCDATA) > <!ATTLIST user id ID #REQUIRED > <!ENTITY abc "上海傳智播客123123"> ]> <users> <user id="u001"> <name>zhangsan</name> <age></age> <addr>&abc;</addr> </user> <user id="u002"> <name>lisi</name> <age/> <addr>&abc;</addr> </user> </users>
Schema它也來約束xml文件的,DTD在約束xml的時候一個xml中只能引入一個DTD,同時DTD它沒法對屬性以及標籤中的數據作數據類型的限定。
Schema它是用來代替DTD來約束xml。
Schema文件自己就是使用xml文件書寫的,同時它對須要約束的xml中的數據有嚴格的限定。學習Schema主要來學習W3C組織定義的如何在Schema中去約束xml的標籤以及屬性,還有屬性的數據類型,以及標籤中子標籤的順序。
要定義一個Schema文件,這時它的擴展名必須是.xsd。在這個文件中根元素必須是schema。
使用Schema來約束xml,Schema在書寫的時候,只須要使用W3C組織提早定義的限定標籤的,以及限定的屬性的那個標籤便可。
第一步:書寫xml文件
<?xml version="1.0" encoding="UTF-8"?> <books> <book> <name>JavaWEB</name> <author>老畢</author> <price>182</price> </book> <book> <name>SSH</name> <author>老於</author> <price>152</price> </book> </books>
第二步:定義schema文件
在定義Schema文件的時候,因爲這個Schema文件自己就是xml,它也要受到別的約束。而這個約束是W3C組織提早定義好的, 在Schema文件中須要提早引入進來在根標籤中使用屬性進行進入: <schema xmlns="http://www.w3.org/2001/XMLSchema" 引入W3C定義的schema書寫的規範 targetNamespace="http://www.itcast.org/book" 給當前的Schema文件起名字(命名空間) 做用是當哪一個xml要引入這個schema約束的時候,必須經過當前targetNamespace 後面書寫的uri地址來引入
<?xml version="1.0" encoding="UTF-8"?> <schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.itcast.org/book" elementFormDefault="qualified"> <element name="books"> <complexType> <sequence> <element name="book"> <complexType> <sequence> <element name="name"></element> <element name="author"></element> <element name="price"></element> </sequence> </complexType> </element> </sequence> </complexType> </element> </schema>
第三步:在xml文件中引入當前的這個Schema
<books xmlns="http://www.itcast.org/book" 它是schema文件中的targetNamespace 屬性後面的值 xsi:schemaLocation="http://www.itcast.org/book book.xsd" 這個是在引入當前的schema文件的真實路徑 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 說明當前的xml是schema一個實例文檔 >
在定義Schema文件的時候,須要在<schema>根標籤中使用 targetNamespace 屬性定義當前schema定義名稱(只是一個分配的名字,根本沒有指向任何文件),在被約束的xml文件中先根據這個名稱引入當前的schema文件,而後在使用 xsi:schemaLocation=」」 引入具體的schema文件。(由於targetNamespace屬性定義的schema名稱,只是一個名稱而已,因此在xml文件中須要經過schemaLocation來聲明指定所遵循的Schema文件的具體位置) (xsi:schemaLocation 使用它引入某個schema時,先要使用名稱空間, 空格 ,文件名) 名稱空間主要功能是用於來 elementFormDefault="qualified|unqualified" 在schema中書寫qualified ,在限定xml中的定義的標籤名必須使用定義的名稱空間。 unqualified 要求根元素必須使用名稱空間,而子元素不能使用名稱空間。
Book2.xsd
<?xml version="1.0" encoding="UTF-8"?> <schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.itcast2.org/book" elementFormDefault="qualified"> <element name="books"> <!--name表明當前的xml中能夠書寫標籤名稱 type數據類型--> <complexType ><!-- complexType 當前的element聲明的標籤是複雜標籤時 ,須要使用complexType來聲明子標籤--> <sequence> <!-- 複雜標籤是指有屬性,或者有子標籤,或者有屬性有子標籤的標籤 簡單標籤是指只有文本內容的標籤 <name>zhangsan</name> 簡單標籤 <name id="u001"></name> 複雜標籤 sequence 表明當前子標籤的順序 --> <element name="book" maxOccurs="unbounded"> <complexType mixed="true"><!—mixed屬性值爲true,book元素間就能夠出現字符文本數據了--> <sequence> <element name="name"></element> <element name="author"></element> <element name="price" type="integer"></element> <any></any> </sequence> </complexType> </element> </sequence> </complexType> </element> </schema>
Name.xsd
<schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.example.org/name" elementFormDefault="qualified"> <element name="name"></element> </schema>
Book2.xml
<?xml version="1.0" encoding="UTF-8"?> <aa:books xmlns:aa="http://www.itcast2.org/book" xmlns:bb="http://www.example.org/name" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.itcast2.org/book book2.xsd http://www.example.org/name name.xsd" > <aa:book> aa:sjdlkfjlkdsjflk <aa:name >JavaWEB</aa:name> <aa:author >老畢</aa:author> <aa:price>182</aa:price> <bb:name>sdgs</bb:name> </aa:book> </aa:books>
w3c組織在定義xml的時候,就規範瞭如何去解析xml文件,其中就定義了使用dom技術來解析xml文件。
DOM:Document Object Medel。文檔對象模型。
w3c給出的dom解析,第一步是先把整個xml文件加載到內存,而後在內存中造成了一顆dom樹。
特色:
一次將全部數據所有加載到內存中;
對xml文檔中每一個節點都當成一個Node對象處理。包括元素、文本、屬性。
缺點就是當文檔數據量很大時,對內存有佔用很大,因此不適合解析大量的數據。
Xml文檔的屬性結構
DOM解析是把整個xml文檔加載到內存中,而後造成一個dom樹,這樣就能夠獲取樹中的全部標籤,屬性,文本內容。
Java實現了相應的dom解析技術:
使用Java提供的Dom技術來解析xml文件
DocumentBuilderFactory:這個是一個工廠類,主要負責生產一個解析xml的解析器對象
newDocumentBuilder()靜態方法能夠獲取到一個用於解析xml的解析器對象
DocumentBuilderFactory.newDocumentBuilder();
獲取到了DocumentBuilder對象
DocumentBuilder 這個類能夠從xml中得到DOM對象
使用parse方法解析一個文件路徑,就能夠獲得當前xml文件對象
解析xml文件首先要獲取到xml文件對象即就是Document對象
// 獲取DOM標籤的信息 @Test public void get() throws Exception { // 獲取工廠實例對象 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); // 獲取解析器對象 DocumentBuilder db = dbf.newDocumentBuilder(); // 解析xml獲取dom對象 Document dom = db.parse("book.xml"); // 獲取根元素: Node node = dom.getFirstChild(); // 獲取標籤的名字 System.out.println(node.getNodeName()); // 獲取到每一個標籤對象,都是一個element的實例對象 Element root = (Element) node; // 獲取books下面的全部book標籤 NodeList nl = root.getElementsByTagName("book"); for (int i = 0; i < nl.getLength(); i++) { // 獲取到每一個book標籤對象 Element book = (Element) nl.item(i); // NodeList book_child = book.getChildNodes(); Element name = (Element) book.getElementsByTagName("name").item(0); Element author = (Element) book.getElementsByTagName("author") .item(0); Element price = (Element) book.getElementsByTagName("price") .item(0); // 獲取name標籤下的文本值 System.out.println(name.getTextContent()); // 獲取標籤上的屬性值 System.out.println(name.getAttribute("id")); // 獲取author標籤下的文本值 System.out.println(author.getTextContent()); // 獲取price標籤下的文本值 System.out.println(price.getTextContent()); System.out.println("-------------------"); } }
/* * 修改dom中標籤的信息 * 把books中的第二個book標籤中的price的值改成100 * */ @Test public void update() throws Exception { // 獲取工廠實例對象 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); // 獲取解析器對象 DocumentBuilder db = dbf.newDocumentBuilder(); // 解析xml獲取dom對象 Document dom = db.parse("book.xml"); //使用dom樹直接根據標籤名獲取對應的標籤對象 Element book = (Element) dom.getElementsByTagName("book").item(1); //獲取price標籤 Element price = (Element) book.getElementsByTagName("price").item(0); price.setTextContent("100"); System.out.println(price.getTextContent()); //把修改的整個dom樹從新寫到文件中 TransformerFactory tff = TransformerFactory.newInstance(); //獲取轉換器 Transformer transformer = tff.newTransformer(); //和文件關聯出去結果對象 StreamResult sr = new StreamResult("book.xml"); //把dom轉成原始數據對象 DOMSource ds = new DOMSource(dom); //保存數據 transformer.transform(ds, sr); }
當要把修改後的xml中的數據保存到xml中須要使用Transformer 類中的transform方法
TransformerFactory這個工廠負責生產一個把dom樹寫到文件中的對象
Transformer 負責把一個dom寫到文件中。
總結:
Java提供的dom操做方式:
第一步:須要獲取到相應的工廠
第二步:根據工廠獲取相應的工具或者解析器對象
第三步:根據解析器獲取dom對象,再操做dom樹中的節點,或者是獲取到相應的工具,而後使用工具對dom樹進行保存等操做