xml解析

Dtd約束和Schema約束node

 

DTD的侷限性app

——DTD不遵循XML的語法,它有本身的一套語法dom

——DTD數據類型有限,只有PCDATA(可看作字符串)ide

——DTD不可擴展工具

Schema的新特性ui

——Schema基於xml語法編碼

——Schema能夠用能處理XML文檔的工具來處理spa

——Schema大大擴充了數據類型,能夠自定義數據類型3d

——Schema支持元素的繼承code

——Schema支持屬性組

 

 

1、Dom解析

  Dom解析是直接把xml文檔加載成Document樹,經過訪問Document對象來獲得節點,經過節點對象來訪問xml文檔的內容

  練習:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<students xmlns="http://www.example.org/s1" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.example.org/s1  s1.xsd">
<student id="34">
<name></name>
<age></age>
<gender></gender>
</student>

<student>
<name></name>
<age></age>
<gender></gender>
</student>

</students>
student.xml
<?xml version="1.0" encoding="UTF-8"?>
<schema xmlns="http://www.w3.org/2001/XMLSchema" 
targetNamespace="http://www.example.org/s1" 
xmlns:tns="http://www.example.org/s1" 
elementFormDefault="qualified">

<element name="students">
<complexType>
<sequence>
<element name="student" maxOccurs="2" minOccurs="1">
<complexType>
<sequence>
<element name="name" type="string" ></element>
<element name="age" type="string"></element>
<element name="gender" type="string"></element>
</sequence>

<attribute name="id" type="int"></attribute>
</complexType>

</element>

</sequence>

</complexType>

</element>



</schema>
s1.xsd
public class DomTest {
    public static void main(String[] args) throws Exception {
        //先獲得一個工廠
        DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
        //從工廠裏拿到文檔建立器
        DocumentBuilder db=dbf.newDocumentBuilder();
        //開始建立文檔
        Document dc=db.parse(new File("WebRoot/Test/student.xml"));
        NodeList list=dc.getElementsByTagName("students");
        Node node=list.item(0);
        System.out.println(node);
        System.out.println(node.getNodeName());
        NodeList list1=node.getChildNodes();
        for (int i = 0; i <list1.getLength(); i++) {
            Node node1=list1.item(i);
            System.out.println(node1.getNodeName());
        }
        
        
    }
查詢操做
public static void main(String[] args) throws Exception {
        DocumentBuilderFactory  dbf=DocumentBuilderFactory.newInstance();
        DocumentBuilder  db=dbf.newDocumentBuilder();
        Document  doc=db.parse(new File("WebRoot/Test/students.xml"));
        //獲得student  的結點
        Node  studentNode =doc.getElementsByTagName("student").item(0);
        Node  nameNode =doc.getElementsByTagName("name").item(0);
        //移除它的子節點
        studentNode.removeChild(nameNode);
        //xml格式化工廠   獲取裏面的格式化類。
        TransformerFactory  tff=TransformerFactory.newInstance();
        //就能夠獲得格式化類
        Transformer  tf=tff.newTransformer();
        //建立資源  資源表明  整個文檔的資源
        //doc 刪除以後的xml
         DOMSource  ds=new DOMSource(doc);
         //表明回寫的目錄
         StreamResult   sr=new StreamResult(new File("WebRoot/Test/students.xml"));
         tf.transform(ds, sr);
    }
刪除操做
public static void main(String[] args) throws Exception {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        DocumentBuilder db = dbf.newDocumentBuilder();
        Document doc = db.parse(new File("WebRoot/Test/students.xml"));
        NodeList list = doc.getElementsByTagName("student");
        Node node = list.item(0);
        // 建立結點 Document 這個對象來建立結點
        Element addEle = doc.createElement("city");
        // 給新建立的這個結點 設置屬性
        addEle.setAttribute("name", "杭州");
        node.appendChild(addEle);
        TransformerFactory tff = TransformerFactory.newInstance();
        // 獲取格式化類
        Transformer tf = tff.newTransformer();
        // 將改變以後的dom文檔傳入
        DOMSource ds = new DOMSource(doc);
        // 回寫的路徑
        StreamResult sr = new StreamResult(
                new File("WebRoot/Test/students.xml"));

        tf.transform(ds, sr);
    }
建立操做

2、SAX解析

  練習:

public class SAXTest {
    
    public static void main(String[] args) throws Exception {
        //建立解析器工廠對象
        SAXParserFactory saxf=SAXParserFactory.newInstance();
        //建立解析器對象
        SAXParser saxp=saxf.newSAXParser();
        //傳入路徑
        saxp.parse(new  File("WebRoot/Test/student.xml"),new myHandler() );
    }
    

}

class myHandler extends DefaultHandler{
    @Override
    public void startDocument() throws SAXException {
        // TODO Auto-generated method stub
       System.out.println("開始 解析文檔。。。。。");
       
    }

    @Override
    public void endDocument() throws SAXException {
        // TODO Auto-generated method stub
       System.out.println("結束解析文檔");
    }

    @Override
    public void startElement(String uri, String localName, String qName,
            Attributes attributes) throws SAXException {
        // TODO Auto-generated method stub
        System.out.println("開始解析元素:"+qName);
    }

    @Override
    public void endElement(String uri, String localName, String qName)
            throws SAXException {
        // TODO Auto-generated method stub
        System.out.println("結束解析元素"+qName);
    }

    @Override
    public void characters(char[] ch, int start, int length)
            throws SAXException {
        // TODO Auto-generated method stub
        String  str=new String(ch, start, length);
        System.out.println("元素數據"+str);
        
    }
}
sax解析

 

DOM和SAX的不一樣:
     1. DOM是基於內存的,無論文件有多大,都會將全部的內容預先裝載到內存中。從而消耗很大的內存空間。而SAX是基於事件的。當某個事件被觸發時,才獲取相應的XML的部分數據,從而無論XML文件有多大,都只佔用了少許的內存空間。
     2. DOM能夠讀取XML也能夠向XML文件中插入數據,而SAX卻只能對XML進行讀取,而不能在文件中插入數據。這也是SAX的一個缺點。
     3.SAX的另外一個缺點:DOM咱們能夠指定要訪問的元素進行隨機訪問,而SAX則不行。SAX是從文檔開始執行遍歷的。而且只能遍歷一次。也就是說咱們不能隨機的訪問XML文件,只能從頭至尾的將XML文件遍歷一次。

 

3、dom4j

  練習:

  

public static void main(String[] args) throws Exception {
         SAXReader reader = new SAXReader();
            //經過解析器 獲取  document  對象   xml 文檔
         Document document = reader.read(new File("WebRoot/Test/students.xml"));
          Element  eleroot=document.getRootElement();
          Element  eleStudent =eleroot.element("student");
          //建立元素用 整個文檔的對象建立
          Element   elecreate = DocumentHelper.createElement("city");
          Attribute  att= DocumentHelper.createAttribute(elecreate, "name", "杭州");
          elecreate.add(att);
          eleStudent.add(elecreate);
          //進行xml  格式 的格式化 
          OutputFormat  out=OutputFormat.createPrettyPrint();
          out.setEncoding("utf-8");
           //回寫的路徑 
          //什麼流能夠設置編碼 ????    
//          XMLWriter   xw=new XMLWriter(
//                  new PrintWriter(new File("WebRoot/Test/students.xml")), 
//                  out);
          
          XMLWriter  xw=new  XMLWriter(new OutputStreamWriter(new FileOutputStream("WebRoot/Test/students.xml"),"utf-8"), out);
           xw.write(document);
           xw.close(); 
    }
dom4j
相關文章
相關標籤/搜索