操做xml文件:DOM、SAX、JDOM、JAXB、Dom4J

1.  DOM(Document Object Model) java


 此 方法主要由W3C提供,它將xml文件所有讀入內存中,而後將各個元素組成一棵數據樹,以便快速的訪問各個節點 。 所以很是消耗系統性能 ,對比較大的文檔不適宜採用DOM方法來解析。 DOM API 直接沿襲了 XML 規範。每一個結點均可以擴展的基於 Node 的接口,就多態性的觀點來說,它是優秀的,可是在 Java 語言中的應用不方便,而且可讀性不強。
 實例:
程序員

 

Java代碼  收藏代碼
  1. import javax.xml.parsers.*;   
  2. //XML解析器接口   
  3. import org.w3c.dom.*;   
  4. //XML的DOM實現   
  5. import org.apache.crimson.tree.XmlDocument;  
  6. //寫XML文件要用到  
  7. DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();  
  8.  //容許名字空間  
  9.  factory.setNamespaceAware(true);  
  10.  //容許驗證  
  11.  factory.setValidating(true);  
  12.  //得到DocumentBuilder的一個實例  
  13. try {   
  14.  DocumentBuilder builder = factory.newDocumentBuilder();  
  15. catch (ParserConfigurationException pce) {   
  16. System.err.println(pce);  
  17. //  出異常時輸出異常信息,而後退出,下同  
  18. System.exit(1);  
  19. }   
  20. //解析文檔,並得到一個Document實例。   
  21. try {   
  22. Document doc = builder.parse(fileURI);  
  23. catch (DOMException dom) {  
  24. System.err.println(dom.getMessage());  
  25. System.exit(1);  
  26. catch (IOException ioe) {  
  27. System.err.println(ioe);  
  28. System.exit(1);       
  29. }  
  30. //得到根節點StuInfo  
  31. Element elmtStuInfo = doc.getDocumentElement();  
  32. //獲得全部student節點  
  33.  NodeList nlStudent = elmtStuInfo.getElementsByTagNameNS(  
  34.                                        strNamespace, "student");  
  35. for (……){  
  36.      //當前student節點元素  
  37.      Element elmtStudent = (Element)nlStudent.item(i);  
  38.      NodeList nlCurrent =              elmtStudent.getElementsByTagNameNS(  
  39.                                      strNamespace, "name");  
  40. }  

 對於讀取得方法實際上是很簡單的,寫入xml文件也是同樣不復雜。apache

 

 

J ava代碼  收藏代碼
  1. DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();   
  2. DocumentBuilder builder = null;   
  3. try {   
  4. builder = factory .newDocumentBuilder();   
  5. catch (ParserConfigurationException pce) {   
  6. System.err.println(pce);   
  7. System.exit(1);   
  8. }  
  9. Document doc = null;   
  10. doc = builder .newDocument();  
  11. //下面是創建XML文檔內容的過程,  
  12. //先創建根元素"學生花名冊"   
  13. Element root = doc.createElement("學生花名冊");   
  14. //根元素添加上文檔   
  15. doc.appendChild(root);   
  16. //創建"學生"元素,添加到根元素   
  17. Element student = doc.createElement("學生");   
  18. student.setAttribute("性別", studentBean.getSex());   
  19. root.appendChild(student);   
  20. //創建"姓名"元素,添加到學生下面,下同   
  21. Element name = doc.createElement("姓名");   
  22. student.appendChild(name);   
  23. Text tName = doc.createTextNode(studentBean.getName());   
  24. name.appendChild(tName);  
  25. Element age = doc.createElement("年齡");   
  26. student.appendChild(age);   
  27. Text tAge = doc.createTextNode(String.valueOf(studentBean.getAge()));   
  28. age.appendChild(tAge);  

 2.SAX (Simple API for XML) app

 

 

此方法主要由XML-DEV 郵件列表的成員開發的,SAX是基於事件的方法,它很相似於標籤庫的處理機制,在標籤開始、結束以及錯誤發生等等地方調用相應的接口實現方法,不是所有文 檔都讀入內存。 SAX具備優異的性能和利用更少的存儲空間特色。SAX 的設計只考慮了功能的強大性,卻沒有考慮程序員使用起來是否方便。框架

使用必須擴展ContentHandler、ErrorHandler、DTDHandler等,可是必須擴展ContentHandler(或者DefaultHandler )。less

 

Java代碼  收藏代碼
  1. import org.xml.sax.*;  
  2. public  class  MyContentHandler implements ContentHandler {  
  3.   … …  
  4. }  
  5. /** 
  6.      * 當其餘某一個調用事件發生時,先調用此方法來在文檔中定位。 
  7.      * @param locator 
  8.      */  
  9.     public void setDocumentLocator(Locator locator){  
  10.     }  
  11. /** 
  12.      * 在解析整個文檔開始時調用 
  13.      * @throws SAXException 
  14.      */  
  15.     public void startDocument() throws SAXException{  
  16.         System.out.println("** Student information start **");  
  17.     }  
  18. /** 
  19.      * 在解析整個文檔結束時調用 
  20.      * @throws SAXException 
  21.      */  
  22.     public void endDocument() throws SAXException{  
  23.         System.out.println("**** Student information end ****");  
  24.     }  
  25. /** 
  26.      * 在解析名字空間開始時調用 
  27.      * @param prefix 
  28.      * @param uri 
  29.      * @throws SAXException 
  30.      */  
  31.     public void startPrefixMapping(String prefix  
  32.         , String uri) throws SAXException{  
  33.     }  
  34. /** 
  35.      * 在解析名字空間結束時調用 
  36.      * @param prefix 
  37.      * @throws SAXException 
  38.      */  
  39.     public void endPrefixMapping(String prefix) throws SAXException{  
  40.     }  
  41. /** 
  42.      * 在解析元素開始時調用 
  43.      * @param namespaceURI 
  44.      * @param localName 
  45.      * @param qName 
  46.      * @param atts 
  47.      * @throws SAXException 
  48.      */  
  49.     public void startElement(String namespaceURI, String localName  
  50.         , String qName, Attributes atts) throws SAXException{  
  51.     }  
  52. /** 在解析元素結束時調用 
  53.      * @param namespaceURI 
  54.      * @param localName 本地名,如student 
  55.      * @param qName 原始名,如LIT:student 
  56.      * @throws SAXException   */  
  57.     public void endElement(String namespaceURI, String localName,String qName) throws SAXException{  
  58.   if (localName.equals(「student」)){  
  59.             System.out.println(localName+":"+currentData);  
  60.         }  
  61. }  

取得元素數據的方法——charactersdom

 

取得元素數據中的空白的方法——ignorableWhitespace
在解析處處理指令時調用的方法——processingInstruction
當未驗證解析器忽略實體時調用的方法——skippedEntity
運行時,只須要使用下列代碼:
工具

 

Java代碼   收藏代碼
  1. MySAXParser mySAXParser = new MySAXParser();  
  2. mySAXParser.parserXMLFile("SutInfo.xml");  

 3.JDOM性能

 

JDOM的處理方式有些相似於DOM,但它主要是用SAX實現的 。JDOM用Java的數據類型來定義操做數據樹的各個節點 。JDOM的性能也很優越。網站

 

Java代碼  收藏代碼
  1. import org.jdom.*;  
  2. import org.jdom.input.*;  
  3. import org.jdom.output.*;  
  4. SAXBuilder builder = new SAXBuilder(false);  
  5. //獲得Document  
  6. Document doc = builder.build(fileURI);  
  7. //名字空間  
  8. Namespace ns = Namespace.getNamespace("LIT" , "http://www.lit.edu.cn/student/ ");  
  9. //取得全部LIT:student節點的集合  
  10. List lstStudents = elmtStuInfo.getChildren("student",ns);  
  11. for ( … ){  
  12.  Element elmtStudent = (Element)lstStudents.get(i);  
  13.  elmtStudent.getChildTextTrim("name", ns);  
  14. }  
  15. //修改  
  16. elmtLesson.getChild("lessonScore" , ns).setText("100");  
  17. //刪除  
  18. elmtStuInfo.removeChild("master", ns);  
  19. //添加  
  20. elmtStuInfo.addContent(new Element("master" , ns).addContent(new Entity("masterName")));  
  21. //輸出文檔  
  22. //第一個參數是縮進字符串,這裏是4個空格。  
  23. //第二個參數是true,表示須要換行。  
  24. XMLOutputter printDoc = new XMLOutputter(" "true);  
  25.  printDoc.output(doc, new FileOutputStream("StuInfo.xml"));  

 4.JAXB (Java And XML Binding)

 

 

JAXB 是以SUN爲主的一些公司公佈的。JAXB將schema(或者DTD)映射爲java對象(.java文件),而後使用這些java對象來解析xml文件。須要使用以前生成java文件,於是要有固定的schema,沒法處理動態的xml文件。

首先使用xjc命令,生成java文件
xjc  [-options ...]

(生成的文件較多)

Java代碼  收藏代碼
  1. JAXBContext jc = JAXBContext.newInstance(「packageName");  
  2.  Unmarshaller unmarshaller = jc.createUnmarshaller();  
  3. Collection collection= (Collection)unmarshaller.unmarshal(new File( "books.xml"));  
  4. CollectionType.BooksType booksType =collection.getBooks();  
  5. List bookList = booksType.getBook();  
  6. for( … ){  
  7.  test.jaxb.BookType book =(test.jaxb.BookType) bookList.get(i);  
  8.  System.out.println("Book Name: " + book.getName().trim());  
  9.    System.out.println("Book ISBN: " +  book.getISBN());  
  10. }  

 

 

補充另外一種方法:(支持XPATH引擎)

 

據悉dom4j在xml解析方面是性能最好的,hibernate等框架都使用它做爲解析的工具。

 

要使用dom4j讀寫XML文檔,須要先下載dom4j包,dom4j官方網站在 http://www.dom4j.org/

目前最新dom4j包下載地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip

 

解開後有兩個包,僅操做XML文檔的話把dom4j-1.6.1.jar加入工程就能夠了,若是須要使用XPath的話還須要加入包jaxen-1.1-beta-7.jar


轉自:http://www.iteye.com/topic/668280

http://www.iteye.com/topic/612837

相關文章
相關標籤/搜索