XML數據如何進行解析呢，方式有哪些？

時間 2021-02-13

標籤 java app 框架 dom 編碼 .net code orm xml 欄目 XML 简体版

原文原文鏈接

問題：XML數據如何進行解析呢，方式有哪些？

上回咱們說到 JSON 解析的四種方式，那麼此次咱們來看看 XML 的四種解析方式。java

解析的四種方式

DOM 解析
SAX 解析
JDOM 解析
DOM4J 解析

案例實操

DOM 解析

DOM（Document Object Model，文檔對象模型），在應用程序中，基於 DOM 的 XML 分析器將一個 XML 文檔轉換成一個對象模型的集合（一般稱爲 DOM 樹），應用程序正是經過對這個對象模型的操做，來實現對 XML 文檔數據的操做。XML 自己是以樹狀的形式出現的，因此 DOM 操做的時候，也將按章樹的形式進行轉換。在整個 DOM 樹中，最大的地方指的是 Document，表示一個文檔，在這個文檔中只存在一個根節點。app

注意：在使用 DOM 操做的時候，每個文字的區域也是一個節點，稱爲文本節點。框架

核心操做接口dom

在 DOM 解析中有如下四個核心的操做接口：ui

Document：此接口表明了整個 XML 文檔，表示的是整棵 DOM 樹的根，提供了對文檔中的數據進行訪問和操做的入口，經過 Document 節點能夠訪問 XML 文件中全部的元素內容。編碼

Node：此接口在整個 DOM 樹中具備舉足輕重的地位，DOM 操做的核心接口中有很大一部分接口是從 Node 接口繼承過來的。例如：Document、Element 等接口，在 DOM 樹中，每個 Node 接口表明了 DOM 樹中的一個節點。.net

NodeList：此接口表示的是一個節點的集合，通常用於表示有順序關係的一組節點，例如：一個節點的子節點，當文檔改變的時候會直接影響到 NodeList 集合。code

NamedNodeMap：此接口表示的是一組節點和其惟一名字對應的一一對應關係，本接口主要用於屬性節點的表示上。orm

DOM 解析過程xml

若是一個程序須要進行 DOM 解析讀取操做的話，也須要按照以下的步驟進行：

① 創建 DocumentBuilderFactory : DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
② 創建 DocumentBuilder: DocumentBuilder builder = factory.newDocumentBuilder();
③ 創建 Document : Document doc = builder.parse(「要解析的文件路徑」);
④ 創建 NodeList : NodeList nl = doc.getElementsByTagName(「讀取節點」);
⑤ 進行 XML 信息讀取

SAX 解析

SAX（Simple API for XML）解析是按照 xml 文件的順序一步一步的來解析。SAX 沒有官方的標準機構，它不屬於任何標準組織或團體，也不屬於任何公司或我的，而是提供任何人使用的一種計算機技術。

SAX（Simple API for XML，操做 XML 的簡單接口），與 DOM 操做不一樣的是，SAX 採用的是一種順序的模式進行訪問，是一種快速讀取 XML 數據的方式。當使用 SAX 解析器進行操做的時候會觸發一系列的事情，當掃描到文檔（document）開始與結束、元素（element）開始與結束時都會調用相關的處理方法，並由這些操做方法做出相應的操做，直至整個文檔掃描結束。

若是要想實現這種 SAX 解析，則確定首先創建一個 SAX 的解析器。

// 一、建立解析器工廠
SAXParserFactory factory = SAXParserFactory.newInstance();
// 二、得到解析器
SAXParser parser = factory.newSAXParser();
// SAX 解析器 ，繼承 DefaultHandler
String path = new File("resource/demo01.xml").getAbsolutePath();
// 解析 
parser.parse(path, new MySaxHandler());

JDOM 解析

在 W3C 自己提供的 XML 操做標準，DOM 和 SAX，可是從開發角度上看，DOM 和 SAX 自己是各有特色的，DOM 能夠修改，但不適合讀取大文件，而 SAX 能夠讀取大文件，可是自己不能修改。所謂的 JDOM = DOM 的可修改 + SAX 的讀取大文件，JDOM 自己是一個免費的開源組件，直接從 www.jdom.org 上下載。

JDOM 操做 xml 經常使用類：

Document：表示整個xml文檔，是一個樹形結構

Eelment：表示一個xml的元素，提供方法操做其子元素，如文本，屬性和名稱空間等

Attribute：表示元素包含的屬性

Text：表示xml文本信息

XMLOutputter：xml輸出流，底層是經過JDK中流實現

Format：提供xml文件輸出的編碼、樣式和排版等設置

咱們發現 JDOM 的輸出操做要比傳統的 DOM 方便得多，並且也更加直觀，包括在輸出的時候都很容易了。此時觀察到的是 JDOM 對於 DOM 解析的支持，可是也說，JDOM 自己也支持了 SAX 的特色；因此，可使用 SAX 進行解析操做。

// 獲取 SAX 解析器
SAXBuilder builder = new SAXBuilder();
File file = new File("resource/demo01.xml");
// 獲取文檔
Document doc = builder.build(new File(file.getAbsolutePath()));  
// 獲取根節點 
Element root = doc.getRootElement();  
System.out.println(root.getName());
// 獲取根節點下全部的子節點， 也能夠根據標籤名稱獲取指定的直接點
List<Element> list = root.getChildren();
System.out.println(list.size());
for(int x = 0; x<list.size(); x++){
    Element e = list.get(x);  
    // 獲取元素的名稱和裏面的文本
    String name = e.getName();
    System.out.println(name + "=" + e.getText());
    System.out.println("==================");
}

DOM4J 解析

dom4j 是一個簡單的開源庫，用於處理 XML、 XPath 和 XSLT，它基於 Java 平臺，使用 Java 的集合框架，全面集成了 DOM，SAX 和 JAXP。下載路徑：

http://www.dom4j.org/dom4j-1....

http://sourceforge.net/projec...

DOM4J 與 JDOM 同樣都屬於一個免費的 XML 開源組件，可是因爲如今的開發框架中使用該技術較多，好比 Hibernate、Spring 等都使用 DOM4J 這個功能，因此做爲介紹，你們能夠對該組件有一個瞭解。並無誰好誰壞，通常框架使用 DOM4J 較多，而咱們平時若是要用則 JDOM 較常見。能夠發現 DOM4J 發揮了不少新特性，好比輸出格式就能夠很好。

File file = new File("resource/outputdom4j.xml");
SAXReader reader = new SAXReader();
// 讀取文件做爲文檔
Document doc = reader.read(file);
// 獲取文檔的根元素
Element root = doc.getRootElement();
// 根據跟元素找到所有的子節點
Iterator<Element> iter = root.elementIterator();
while(iter.hasNext()){
    Element name = iter.next();
    System.out.println("value = " + name.getText());
}

擴展~XML的建立

DOM 建立

若是想要生成 XML 文件，則在建立文檔的時候，就應該使用 newDocument() 方法

若是要將 DOM 的文檔輸出，自己是比較麻煩的。一次編寫屢次 copy

public static void createXml() throws Exception{  
    //獲取解析器工廠 
    DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();  
    //獲取解析器 
    DocumentBuilder builder=factory.newDocumentBuilder();  
    //建立文檔 
    Document doc=builder.newDocument();  
    //建立元素、設置關係 
    Element root=doc.createElement("people");  
    Element person=doc.createElement("person");  
    Element name=doc.createElement("name");  
    Element age=doc.createElement("age");  
    name.appendChild(doc.createTextNode("lebyte"));  
    age.appendChild(doc.createTextNode("10"));  
    doc.appendChild(root);  
    root.appendChild(person);  
    person.appendChild(name);  
    person.appendChild(age);  
    //寫出去 
    // 得到變壓器工廠 
    TransformerFactory tsf=TransformerFactory.newInstance();  
    Transformer ts=tsf.newTransformer();  
    //設置編碼 
    ts.setOutputProperty(OutputKeys.ENCODING, "UTF-8");  
    //建立帶有 DOM 節點的新輸入源，充當轉換 Source 樹的持有者 
    DOMSource source=new DOMSource(doc);  
    //充當轉換結果的持有者 
    File file=new File("src/output.xml");  
    StreamResult result=new StreamResult(file);  
    ts.transform(source, result);  
}

SAX 建立

//建立一個SAXtransformerfactory對象
SAXTransformerFactory stf = (SAXTransformerFactory) SAXTransformerFactory.newInstance();
try {
    //經過SAXTransformerFactory對象建立一個TransfomerHandler對象
    TransformerHandler handler = stf.newTransformerHandler();
    //經過transformerHandler對象建立一個transformer對象
    Transformer tf = handler.getTransformer();
    //設置Transfomer對象的屬性
    tf.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
    tf.setOutputProperty(OutputKeys.INDENT, "yes");
    //建立一個Result的對象，將其與handler關聯
    File file = new File("src/output.xml");
    if(!file.exists()){
        file.createNewFile();
    }
    Result result = new StreamResult(new FileOutputStream(file));
    handler.setResult(result);
    //經過Handler編寫XML的內容 
    //打開Document 
    handler.startDocument();
    AttributesImpl attr = new AttributesImpl();
    //建立根節點bookstore
    handler.startElement("", "", "bookstore", attr);
    attr.clear();
    attr.addAttribute("", "", "id", "", "1");
    handler.startElement("", "", "book", attr);
    attr.clear();
    handler.startElement("", "", "name", attr);
    handler.characters("頸椎病康復指南".toCharArray(), 0, "頸椎病康復指南".length());
    handler.endElement("","","name");
    //關閉各節點
    handler.endElement("", "", "book");
    handler.endElement("", "", "bookstore");
    handler.endDocument();
} catch (SAXException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
} catch (FileNotFoundException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
} catch (IOException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
} catch (TransformerConfigurationException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
}

JDOM 建立

// 建立節點 
Element person = new Element("person");  
Element name = new Element("name");  
Element age = new Element("age");  
// 建立屬性 
Attribute id = new Attribute("id","1");  
// 設置文本 
name.setText("lebyte");  
age.setText("10");  
// 設置關係 
Document doc = new Document(person);  
person.addContent(name);  
name.setAttribute(id);  
person.addContent(age);  
XMLOutputter out = new XMLOutputter();  
File file = new File("resource/outputjdom.xml");  
out.output(doc, new FileOutputStream(file.getAbsoluteFile()));

DOM4J 建立

// 使用 DocumentHelper 來建立 Document 對象 
Document document = DocumentHelper.createDocument();  
// 建立元素並設置關係 
Element person = document.addElement("person");  
Element name = person.addElement("name");   
Element age = person.addElement("age");  
// 設置文本  name.setText("lebyte"); 
age.setText("10"); 
// 建立格式化輸出器 
OutputFormat of = OutputFormat.createPrettyPrint();  
of.setEncoding("utf-8");  
// 輸出到文件 
File file = new File("resource/outputdom4j.xml");  
XMLWriter writer = new XMLWriter(new FileOutputStream(new  File(file.getAbsolutePath())),of);  
// 寫出 
writer.write(document);  
writer.flush();  
writer.close();