XML Dom4j和Pull 官網中簡單介紹

            Dom4j

 

Parsing XML

  One of the first things you'll probably want to do is to parse an XML document of some kind. This is easy to do in <dom4j>. The following code demonstrates how to this.html

解析:java

  首先你可能會想要去解析各類XML文件,在dom4j中這是很容易的。如下代碼演示了這麼解析。node

import java.net.URL; import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.io.SAXReader; public class Foo { public Document parse(URL url) throws DocumentException { SAXReader reader = new SAXReader(); Document document = reader.read(url); return document; } }

 

Using Iterators

  A document can be navigated using a variety of methods that return standard Java Iterators. For examplegit

使用迭代器github

  使用不一樣的方式來操做文件以得到java的標準迭代器,例如:express

public void bar(Document document) throws DocumentException { Element root = document.getRootElement(); // iterate through child elements of root

    for (Iterator<Element> it = root.elementIterator(); it.hasNext();) { Element element = it.next(); // do something
 } // iterate through child elements of root with element name "foo"

    for (Iterator<Element> it = root.elementIterator("foo"); it.hasNext();) { Element foo = it.next(); // do something
 } // iterate through attributes of root

    for (Iterator<Attribute> it = root.attributeIterator(); it.hasNext();) { Attribute attribute = it.next(); // do something
 } }

 

 

Powerful Navigation with XPath

  In <dom4j> XPath expressions can be evaluated on the Document or on any Node in the tree (such as Attribute, Element orProcessingInstruction). This allows complex navigation throughout the document with a single line of code. For exampleapache

 

XPath強大的導航能力oracle

  Dom4j 中的XPath表達式能夠在文檔或者樹的任何節點(例如屬性,元素或者進程指令)上求值,它使用一行代碼在整個文檔中進行復雜的導航,例如:app

public void bar(Document document) { List<Node> list = document.selectNodes("//foo/bar"); Node node = document.selectSingleNode("//foo/bar/author"); String name = node.valueOf("@name"); } 

 

 

For example if you wish to find all the hypertext links in an XHTML document the following code would do the trick.dom

舉個例子,若是你想要找到XHTML文檔中全部的超文本連接,能夠根據如下的代碼。

 

public void findLinks(Document document) throws DocumentException { List<Node> list = document.selectNodes("//a/@href"); for (Iterator<Node> iter = list.iterator(); iter.hasNext();) { Attribute attribute = (Attribute) iter.next(); String url = attribute.getValue(); } }

 

 

If you need any help learning the XPath language we highly recommend the Zvon tutorial which allows you to learn by example.

若是您須要幫助學習XPath語言,咱們強烈推薦Zvon教程,它容許您經過示例學習

 

Fast Looping

  If you ever have to walk a large XML document tree then for performance we recommend you use the fast looping method which avoids the cost of creating an Iterator object for each loop. For example

快速循環

  若是您必須遍歷大型XML文檔樹,那麼爲了提升性能,咱們建議您使用快速循環方法,這樣能夠避免爲每一個循環建立迭代器對象的成本。例如

public void treeWalk(Document document) { treeWalk(document.getRootElement()); } public void treeWalk(Element element) { for (int i = 0, size = element.nodeCount(); i < size; i++) { Node node = element.node(i); if (node instanceof Element) { treeWalk((Element) node); } else { // do something…
 } } }

 

Creating a new XML document

  Often in <dom4j> you will need to create a new document from scratch. Here's an example of doing that.

新建一個XML文檔

  在dom4j中你將會常常從頭開始建立一個新的文檔,下面就是新建文檔的例子。

import org.dom4j.Document; import org.dom4j.DocumentHelper; import org.dom4j.Element; public class Foo { public Document createDocument() { Document document = DocumentHelper.createDocument(); Element root = document.addElement("root"); Element author1 = root.addElement("author") .addAttribute("name", "James") .addAttribute("location", "UK") .addText("James Strachan"); Element author2 = root.addElement("author") .addAttribute("name", "Bob") .addAttribute("location", "US") .addText("Bob McWhirter"); return document; } }

 

 

 

Writing a document to a file

  A quick and easy way to write a Document (or any Node) to a Writer is via the write() method.

把文檔寫到文件中

  向寫入器寫入文檔(或任何節點)的快速簡便方法是經過write()方法。

FileWriter out = new FileWriter("foo.xml"); document.write(out); out.close(); 

 

  If you want to be able to change the format of the output, such as pretty printing or a compact format, or you want to be able to work with Writer objects or OutputStream objects as the destination, then you can use the XMLWriter class.

  若是但願可以更改輸出的格式,好比漂亮的打印或緊湊格式,或者但願可以使用Writer對象或OutputStream對象做爲目標,那麼可使用XMLWriter類。

 

import org.dom4j.Document; import org.dom4j.io.OutputFormat; import org.dom4j.io.XMLWriter; public class Foo { public void write(Document document) throws IOException { // lets write to a file

        try (FileWriter fileWiter = new FileWriter("output.xml")) { XMLWriter writer = new XMLWriter(fileWriter); writer.write( document ); writer.close(); } // Pretty print the document to System.out
 OutputFormat format = OutputFormat.createPrettyPrint(); writer = new XMLWriter(System.out, format); writer.write( document ); // Compact format to System.out
 format = OutputFormat.createCompactFormat(); writer = new XMLWriter(System.out, format); writer.write(document); writer.close(); } }

 

 

Converting to and from Strings

  If you have a reference to a Document or any other Node such as an Attribute or Element, you can turn it into the default XML text via the asXML() method.

字符串的轉換

  若是您有對文檔或任何其餘節點(如屬性或元素)的引用,您能夠經過asXML()方法將其轉換爲默認的XML文本。

 

 

Document document = …; String text = document.asXML();

 

  If you have some XML as a String you can parse it back into a Document again using the helper method DocumentHelper.parseText()

  若是有一些XML做爲字符串,可使用輔助方法DocumentHelper.parseText()將其解析迴文檔

 

String text = "<person> <name>James</name> </person>"; Document document = DocumentHelper.parseText(text);

 

Transforming a Document with XSLT

  Applying XSLT on a Document is quite straightforward using the JAXP API from Oracle. This allows you to work against any XSLT engine such as Xalan or Saxon. Here is an example of using JAXP to create a transformer and then applying it to a Document.

 

使用XSLT轉換文檔

  使用OracleJAXP API對文檔應用XSLT很是簡單。這容許您對抗任何XSLT引擎,好比XalanSaxon。下面是一個使用JAXP建立轉換器並將其應用到文檔的示例。

 

import javax.xml.transform.Transformer; import javax.xml.transform.TransformerFactory; import org.dom4j.Document; import org.dom4j.io.DocumentResult; import org.dom4j.io.DocumentSource; public class Foo { public Document styleDocument(Document document, String stylesheet) throws Exception { // load the transformer using JAXP
 TransformerFactory factory = TransformerFactory.newInstance(); Transformer transformer = factory.newTransformer(new StreamSource(stylesheet)); // now lets style the given document
 DocumentSource source = new DocumentSource(document); DocumentResult result = new DocumentResult(); transformer.transform(source, result); // return the transformed document
 Document transformedDoc = result.getDocument(); return transformedDoc; } }


 

 

 

 


    XMLPULL

主要的特色:

 

  一、simple interface 接口單一

     二、implementation independent實現獨立

  三、ease of use 操做簡單    

    •   START DOCUMENT
    •   START_TAG
    •   TEXT
    •   END_TAG
    •   END_DOCUMENT

  四、versatility 多功能性

  五、performance  性能較好

  六、minimal requirements 需求小(設備的要求,內存等)

 
 

Code step-by-step

 

  首先咱們要建立一個解析器實例,這個要求有如下三個步驟:

 

    一、得到XMLPULL工廠實例

 

    二、(可選步驟)默認狀況下的工廠模式將生成沒有名稱空間的解析器;要更改setNamespaceAware()函數,必需要被調用

 

    三、建立一個解析器的實例

 

如下代碼爲實現方式:

 
XmlPullParserFactory factory=XmlPullParserFactory.newInstance(); factory.setNamespaceAware(true); XmlPullPArser xpp=factory.newPullParser();
 

下一步是設置解析器的輸入:

 
xpp.setInput(new FileReader(args [i]));

 

 

  接下來就能夠開始進行解析了。

 

    爲了檢索下一個事件,典型的XMLPULL應用將會反覆地調用next()函數,直到END_DOCUMENT事件,進程纔會被中止。

 
public void processDocument(XmlPullParser xpp)throws Exception{   int eventType=xpp.getType();   do{     if(eventType==xpp.START_DOCUMENT){     System.out.println(「Start document」);     }else if(eventType==xpp.END_DOCUMENT){       System.out.println(「End documen!」);     }else if(eventType == xpp.START_TAG) {       processStartElement(xpp);     } else if(eventType == xpp.END_TAG) {        processEndElement(xpp);     } else if(eventType == xpp.TEXT) {       processText(xpp);     }     eventType = xpp.next();   } while (eventType != xpp.END_DOCUMENT); } }

 

 

  讓咱們看看如何處理start標記,與處理結束標籤是很是類似的-主要的區別是結束標籤沒有屬性。

 
public void processStartElement (XmlPullParser xpp) { String name = xpp.getName(); String uri = xpp.getNamespace(); if ("".equals (uri)) { System.out.println("Start element: " + name); } else { System.out.println("Start element: {" + uri + "}" + name); } }

 

  如今讓咱們看看如何檢索和打印元素內容:

 
public void processText (XmlPullParser xpp) throws XmlPullParserException { char ch[] = xpp.getTextCharacters(); int start = xpp.getTextCharactersStart(); int length = xpp.getTextCharactersLength(); System.out.print("Characters: \""); for (int i = start; i < start + length; i++) { switch (ch[i]) { case '\\': System.out.print("\\\\"); break; case '"': System.out.print("\\\""); break; case '\n': System.out.print("\\n"); break; case '\r': System.out.print("\\r"); break; case '\t': System.out.print("\\t"); break; default: System.out.print(ch[i]); break; } } System.out.print("\"\n"); }
相關文章
相關標籤/搜索