操做xml文件：DOM、SAX、JDOM、JAXB、Dom4J

1. DOM(Document Object Model) java

此方法主要由W3C提供，它將xml文件所有讀入內存中，而後將各個元素組成一棵數據樹，以便快速的訪問各個節點。所以很是消耗系統性能，對比較大的文檔不適宜採用DOM方法來解析。 DOM API 直接沿襲了 XML 規範。每一個結點均可以擴展的基於 Node 的接口，就多態性的觀點來說，它是優秀的，可是在 Java 語言中的應用不方便，而且可讀性不強。
實例：程序員

Java代碼

import javax.xml.parsers.*;
//XML解析器接口
import org.w3c.dom.*;
//XML的DOM實現
import org.apache.crimson.tree.XmlDocument;
//寫XML文件要用到
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//容許名字空間
factory.setNamespaceAware(true);
//容許驗證
factory.setValidating(true);
//得到DocumentBuilder的一個實例
try {
DocumentBuilder builder = factory.newDocumentBuilder();
} catch (ParserConfigurationException pce) {
System.err.println(pce);
// 出異常時輸出異常信息，而後退出，下同
System.exit(1);
}
//解析文檔，並得到一個Document實例。
try {
Document doc = builder.parse(fileURI);
} catch (DOMException dom) {
System.err.println(dom.getMessage());
System.exit(1);
} catch (IOException ioe) {
System.err.println(ioe);
System.exit(1);
}
//得到根節點StuInfo
Element elmtStuInfo = doc.getDocumentElement();
//獲得全部student節點
NodeList nlStudent = elmtStuInfo.getElementsByTagNameNS(
strNamespace, "student");
for (……){
//當前student節點元素
Element elmtStudent = (Element)nlStudent.item(i);
NodeList nlCurrent = elmtStudent.getElementsByTagNameNS(
strNamespace, "name");
}

對於讀取得方法實際上是很簡單的，寫入xml文件也是同樣不復雜。apache

J ava代碼

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = null;
try {
builder = factory .newDocumentBuilder();
} catch (ParserConfigurationException pce) {
System.err.println(pce);
System.exit(1);
}
Document doc = null;
doc = builder .newDocument();
//下面是創建XML文檔內容的過程，
//先創建根元素"學生花名冊"
Element root = doc.createElement("學生花名冊");
//根元素添加上文檔
doc.appendChild(root);
//創建"學生"元素，添加到根元素
Element student = doc.createElement("學生");
student.setAttribute("性別", studentBean.getSex());
root.appendChild(student);
//創建"姓名"元素，添加到學生下面，下同
Element name = doc.createElement("姓名");
student.appendChild(name);
Text tName = doc.createTextNode(studentBean.getName());
name.appendChild(tName);
Element age = doc.createElement("年齡");
student.appendChild(age);
Text tAge = doc.createTextNode(String.valueOf(studentBean.getAge()));
age.appendChild(tAge);

2.SAX (Simple API for XML) app

此方法主要由XML-DEV 郵件列表的成員開發的，SAX是基於事件的方法，它很相似於標籤庫的處理機制，在標籤開始、結束以及錯誤發生等等地方調用相應的接口實現方法，不是所有文檔都讀入內存。 SAX具備優異的性能和利用更少的存儲空間特色。SAX 的設計只考慮了功能的強大性，卻沒有考慮程序員使用起來是否方便。框架

使用必須擴展ContentHandler、ErrorHandler、DTDHandler等，可是必須擴展ContentHandler（或者DefaultHandler ）。less

Java代碼

import org.xml.sax.*;
public class MyContentHandler implements ContentHandler {
… …
}
/**
* 當其餘某一個調用事件發生時，先調用此方法來在文檔中定位。
* @param locator
*/
public void setDocumentLocator(Locator locator){
}
/**
* 在解析整個文檔開始時調用
* @throws SAXException
*/
public void startDocument() throws SAXException{
System.out.println("** Student information start **");
}
/**
* 在解析整個文檔結束時調用
* @throws SAXException
*/
public void endDocument() throws SAXException{
System.out.println("**** Student information end ****");
}
/**
* 在解析名字空間開始時調用
* @param prefix
* @param uri
* @throws SAXException
*/
public void startPrefixMapping(String prefix
, String uri) throws SAXException{
}
/**
* 在解析名字空間結束時調用
* @param prefix
* @throws SAXException
*/
public void endPrefixMapping(String prefix) throws SAXException{
}
/**
* 在解析元素開始時調用
* @param namespaceURI
* @param localName
* @param qName
* @param atts
* @throws SAXException
*/
public void startElement(String namespaceURI, String localName
, String qName, Attributes atts) throws SAXException{
}
/** 在解析元素結束時調用
* @param namespaceURI
* @param localName 本地名，如student
* @param qName 原始名，如LIT:student
* @throws SAXException */
public void endElement(String namespaceURI, String localName,String qName) throws SAXException{
if (localName.equals(「student」)){
System.out.println(localName+":"+currentData);
}
}

取得元素數據的方法——charactersdom

取得元素數據中的空白的方法——ignorableWhitespace
在解析處處理指令時調用的方法——processingInstruction
當未驗證解析器忽略實體時調用的方法——skippedEntity
運行時，只須要使用下列代碼：工具

Java代碼

MySAXParser mySAXParser = new MySAXParser();
mySAXParser.parserXMLFile("SutInfo.xml");

3.JDOM性能

JDOM的處理方式有些相似於DOM，但它主要是用SAX實現的。JDOM用Java的數據類型來定義操做數據樹的各個節點。JDOM的性能也很優越。網站

Java代碼

import org.jdom.*;
import org.jdom.input.*;
import org.jdom.output.*;
SAXBuilder builder = new SAXBuilder(false);
//獲得Document
Document doc = builder.build(fileURI);
//名字空間
Namespace ns = Namespace.getNamespace("LIT" , "http://www.lit.edu.cn/student/ ");
//取得全部LIT:student節點的集合
List lstStudents = elmtStuInfo.getChildren("student",ns);
for ( … ){
Element elmtStudent = (Element)lstStudents.get(i);
elmtStudent.getChildTextTrim("name", ns);
}
//修改
elmtLesson.getChild("lessonScore" , ns).setText("100");
//刪除
elmtStuInfo.removeChild("master", ns);
//添加
elmtStuInfo.addContent(new Element("master" , ns).addContent(new Entity("masterName")));
//輸出文檔
//第一個參數是縮進字符串，這裏是4個空格。
//第二個參數是true，表示須要換行。
XMLOutputter printDoc = new XMLOutputter(" ", true);
printDoc.output(doc, new FileOutputStream("StuInfo.xml"));

4.JAXB (Java And XML Binding)

JAXB 是以SUN爲主的一些公司公佈的。JAXB將schema（或者DTD）映射爲java對象（.java文件），而後使用這些java對象來解析xml文件。須要使用以前生成java文件，於是要有固定的schema，沒法處理動態的xml文件。

首先使用xjc命令，生成java文件
xjc [-options ...]

(生成的文件較多)

Java代碼

JAXBContext jc = JAXBContext.newInstance(「packageName");
Unmarshaller unmarshaller = jc.createUnmarshaller();
Collection collection= (Collection)unmarshaller.unmarshal(new File( "books.xml"));
CollectionType.BooksType booksType =collection.getBooks();
List bookList = booksType.getBook();
for( … ){
test.jaxb.BookType book =(test.jaxb.BookType) bookList.get(i);
System.out.println("Book Name: " + book.getName().trim());
System.out.println("Book ISBN: " + book.getISBN());
}

補充另外一種方法：(支持XPATH引擎)

據悉dom4j在xml解析方面是性能最好的，hibernate等框架都使用它做爲解析的工具。

要使用dom4j讀寫XML文檔,須要先下載dom4j包,dom4j官方網站在 http://www.dom4j.org/

目前最新dom4j包下載地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip

解開後有兩個包,僅操做XML文檔的話把dom4j-1.6.1.jar加入工程就能夠了,若是須要使用XPath的話還須要加入包jaxen-1.1-beta-7.jar

轉自:http://www.iteye.com/topic/668280

http://www.iteye.com/topic/612837