Java開源Html解析類庫(轉載)

  NekoHTML  NekoHTML是一個簡單地HTML掃描器和標籤補償器(tag balancer) ,使得程序能解析HTML文檔並用標準的XML接口來訪問其中的信息。這個解析器能投掃描HTML文件並「修正」許多做者(人或機器)在編寫HTML文檔過程當中常犯的錯誤。NekoHTML能增補缺失的父元素、自動用結束標籤關閉相應的元素,以及不匹配的內嵌元素標籤。NekoHTML的開發使用了Xerc
相關文章
相關標籤/搜索