//生成DOM字符串結構 HtmlNode container = HtmlNode.CreateNode("<div />"); HtmlNode title = HtmlNode.CreateNode("<h3 />"); title.InnerHtml = "張三丰"; HtmlNode link = HtmlNode.CreateNode("<a />"); link.InnerHtml = "點擊進入"; link.SetAttributeValue("href", "http://wwww.gongjuji.net"); container.AppendChild(title).AppendChild(link); Console.WriteLine(container.OuterHtml);
//解析html 字符串或者本地html文件 HtmlDocument doc = new HtmlDocument(); string html = "<div id=\"demo\"><span style=\"color: red; \"><h1>Hello</h1> </span></div>"; doc.LoadHtml(html); HtmlNode demo = doc.GetElementbyId("demo"); Console.WriteLine(demo.InnerHtml); //注:InnerText中會有換行或空格等,須要特殊處理 Console.WriteLine(demo.InnerText); Console.WriteLine(demo.InnerText.Length);
XPath簡明介紹
XPath 使用路徑表達式來選取 XML 文檔中的節點或節點集。節點是經過沿着路徑 (path) 或者步 (steps) 來選取的。
下面列出了最有用的路徑表達式:
nodename:選取此節點的全部子節點。
/:從根節點選取。
//:從匹配選擇的當前節點選擇文檔中的節點,而不考慮它們的位置。
.:選取當前節點。
..:選取當前節點的父節點。
php
<?xml version="1.0" encoding="utf-8"?> <Articles> <Article> <Title>在ASP.NET中使用Highcharts js圖表</title> <Url>http://zhoufoxcn.blog.51cto.com/792419/537324</Url> <CreateAt type="en">2011-04-07</price> </Article> <Article> <Title lang="eng">Log4Net使用詳解(續)</title> <Url>http://blog.csdn.net/zhoufoxcn/archive/2010/11/23/6029021.aspx</Url> <CreateAt type="zh-cn">2010年11月23日</price> </Article> <Article> <Title>J2ME開發的通常步驟</title> <Url>http://blog.csdn.net/zhoufoxcn/archive/2011/06/12/6540223.aspx</Url> <CreateAt type="zh-cn">2011年06月12日</price> </Article> <Article> <Title lang="eng">PowerDesign高級應用</title> <Url>http://zhoufoxcn.blog.51cto.com/792419/166415</Url> <CreateAt type="zh-cn">2007-09-08</price> </Article> </Articles>