使用RegularExpressions去除HTML標籤的字符串

一、需求場景

  由於須要作一個推送數據的服務,須要調用webservice,因爲某種緣由須要使用用http發送soap請求,而推送的數據是json格式的,在測試過程當中發現請求失敗,服務端webservice返回400錯誤。返回400錯誤,應該就是請求的數據格式不對,因爲我這個狀況特殊,請求的數據既要可以格式化爲xml格式,裏面某個節點裏的內容還要可以正確格式化爲json字符串,發現請求的數據裏有HTML標籤,須要過濾掉再請求。web

二、實現功能

  使用RegularExpressions正則表達式:正則表達式

  .   匹配除 "\n" 以外的任何單個字符。json

  *  匹配前面的子表達式零次或屢次。測試

  ?  匹配前面的子表達式零次或一次。spa

       只要把文章的"<.*?>"替換爲String.Empty便可。code

 

       代碼實現 xml

using System.Text.RegularExpressions;

public static string RemoveHtmlTag(string articleString)
{
      return Regex.Replace(articleString, "<.*?>", string.Empty);
}       
相關文章
相關標籤/搜索