複習:html
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Text.RegularExpressions; using System.Runtime.Serialization.Formatters.Binary; using System.IO; namespace _01做業問題 { class Program { static void Main(string[] args) { #region 正則 //Regex regex = new Regex(@"^\d{6}$", RegexOptions.ECMAScript); //while (true) //{ // Console.WriteLine("請輸入一個字符串"); // string postcode = Console.ReadLine(); // bool b = regex.IsMatch(postcode); // Console.WriteLine(b); //} #endregion #region 二進制序列化的步驟 // //建立一個二進制序列化器 // BinaryFormatter bf = new BinaryFormatter(); //using (FileStream fsWrite = File.OpenWrite("data")) //{ // //2.執行序列化或者反序列化 // //調用序列化的時候,須要傳遞兩個參數,一個是流,另外一個是須要序列化的對象 // bf.Serialize(fsWrite,new MyClass()); //} //Console.WriteLine("OK"); #endregion #region 二進制反序列化的步驟 //BinaryFormatter bf = new BinaryFormatter(); //using (FileStream fsRead = File.OpenRead("data")) //{ // object obj = bf.Deserialize(fsRead); // MyClass mc = obj as MyClass; //} //Console.WriteLine("OK"); #endregion #region MyRegion //while (true) //{ // Console.WriteLine("請輸入一個字符串"); // string input = Console.ReadLine(); // ////表示只有用戶輸入一個數字字符的時候才返回true // //bool b = Regex.IsMatch(input,"^\\d$"); // //表示只有用戶輸入\d的時候返回true,不然輸入其它內容都返回false // //bool b = Regex.IsMatch(input, "^\\\\d$"); // bool b = Regex.IsMatch(input, @"^\\d$"); // Console.WriteLine(b); //} #endregion #region 匹配IP地址,4段用.分割的最多的三位數字。192.168.54.7七、333.333.333.333假設都是正確的 //while (true) //{ // Console.WriteLine("請輸入一個字符串"); // string ip = Console.ReadLine(); // bool b = Regex.IsMatch(ip, @"^(\d{1,3}\.){3}\d{1,3}$",RegexOptions.ECMAScript); // Console.WriteLine(b); //} #endregion #region 判斷是不是合法的日期「2008-08-08」.四位數字-兩位數字-兩位數字 //while (true) //{ // Console.WriteLine("請輸入日期"); // string date = Console.ReadLine(); // //bool b = Regex.IsMatch(date, @"^\d{4}-\d{2}-\d{2}$", RegexOptions.ECMAScript); // bool b = Regex.IsMatch(date, @"^\d{4}-(0[1-9]|1[0-2])-\d{2}$", RegexOptions.ECMAScript); // Console.WriteLine(b); //} #endregion #region 判斷是不是合法的url地址 //while (true) //{ // Console.WriteLine("請輸入"); // string url = Console.ReadLine(); // bool b = Regex.IsMatch(url, @"^[a-zA-Z0-9]+://.+$"); // Console.WriteLine(b); //} #endregion } } [Serializable] class MyClass { } }
字符串提取與正則表達式提取-提取組 web
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Text.RegularExpressions; using System.IO; namespace _02正則表達式提取 { class Program { static void Main(string[] args) { #region 提取出字符串中的全部數字 //string msg = "你們好呀,hello,2015年 3月30日是個好日子,恩恩 9494,吼吼886"; ////字符串提取 Match()和 Matches() ////提取第一個匹配的字符串,只提取一個。 ////Match match = Regex.Match(msg, @"\d", RegexOptions.ECMAScript);//2 //Match match = Regex.Match(msg, @"\d+", RegexOptions.ECMAScript);//2015 //Console.WriteLine(match.Value); //Console.ReadLine(); ////逐個提取 ////Match match1 = Regex.Match(msg, @"\d+", RegexOptions.ECMAScript);//2015 ////match1.Index= ////Console.WriteLine(match1.Value); //Regex regex = new Regex(@"\d+", RegexOptions.ECMAScript); //Match match = regex.Match(msg); //Console.WriteLine(match.Value); //match = regex.Match(msg,match.Index+match.Value.Length); //Console.WriteLine(match.Value); //match = regex.Match(msg, match.Index + match.Value.Length); //Console.WriteLine(match.Value); //Console.ReadLine(); ////逐個提取 ////通常在調用IsMatch()的時候要判斷徹底匹配,因此要加^$ ////可是在Match()和 Matches()的時候,是要從一個大字符串中提取某一部分匹配的內同因此不能加^$ ////若是加了,則必須整個大字符串與給定的正則表達式徹底匹配 //Regex regex = new Regex(@"\d+", RegexOptions.ECMAScript); //Match match = regex.Match(msg); //while (match.Value.Length!=0) //{ // Console.WriteLine(match.Value); // match = regex.Match(msg, match.Index + match.Value.Length); //} //Console.ReadLine(); ////提取全部匹配的字符串 // MatchCollection matches = Regex.Matches(msg, @"\d+", RegexOptions.ECMAScript); // for (int i = 0; i < matches.Count; i++) // { // Console.WriteLine(matches[i].Value); // } // Console.ReadLine(); //判斷是否匹配 //Regex.IsMatch() #endregion #region 從文件中提取Email地址 ////1.讀取文件中的內容到字符串 //string html = File.ReadAllText("提取Email.htm"); ////2.建立正則表達式 //MatchCollection matches = Regex.Matches(html, @"[-a-zA-Z0-9._]+@[-a-zA-Z0-9]+(\.[a-zA-Z0-9]+){1,}", RegexOptions.ECMAScript); ////3.進行提取 //for (int i = 0; i < matches.Count; i++) //{ // //4.輸出 // Console.WriteLine(matches[i].Value); //} //Console.ReadLine(); #endregion #region 統計葉長種個數 //string msg = "你們好哦,我叫葉長種,葉長種是個好孩子,哈哈哈哈哈哈·····你有認識叫葉長種的嗎"; //MatchCollection matches = Regex.Matches(msg, "葉長種"); //foreach (Match item in matches) //{ // Console.WriteLine(item.Index); //} //Console.WriteLine("一共出現了{0}次",matches.Count); //Console.ReadLine(); #endregion #region 字符串提取 ////1.從一個大字符串中提取 某一部分字符串 ////2.在提取到的字符串中,在提取其中的某部分 ////提取組 ////1.讀取文件中的內容到字符串 //string html = File.ReadAllText("提取Email.htm"); ////2.建立正則表達式 //MatchCollection matches = Regex.Matches(html, @"[-a-zA-Z0-9._]+@[-a-zA-Z0-9]+(\.[a-zA-Z0-9]+){1,}", RegexOptions.ECMAScript); ////()()(()()) 按照括號來分組 //foreach (Match item in matches) //{ // Console.WriteLine(item.Value+"================"+item.Groups[1].Value); //} //Console.WriteLine(matches.Count); //Console.ReadLine(); #endregion #region 提取組2 //Match match = Regex.Match("age=30",@"^(.+)=(.+)$"); //Console.WriteLine(match.Groups[1].Value+"============="+match.Groups[2].Value); //Console.ReadKey(); #endregion #region 從文件路徑中提取文件名 ////普通的字符串提取:Match().Matches(),思路是從整個字符串中找出全部那些匹配正則表達式的字符串 ////提取組的思路:先寫一個能知足整個字符串的正則表達式,而後再正則表達式中用括號講那些你想要提取的內容擴起來 ////這樣就能夠提取你想要的組了 //string path = @"c:\windows\testb.txt"; //Match match=Regex.Match(path, @".+\\(.+)"); //Console.WriteLine(match.Groups[1].Value); //Console.ReadKey(); #endregion #region 提取年月日 //string msg = "June 26 , 1951 "; //Match match = Regex.Match(msg,@"^([a-zA-Z]+)\s*(\d{1,2})\s*,\s*(\d{4})\s*$"); //Console.WriteLine(match.Groups[1].Value); //Console.WriteLine(match.Groups[2].Value); //Console.WriteLine(match.Groups[3].Value); //Console.ReadKey(); #endregion #region 從Email中提取出用戶名和域名,好比從test@163.com中提取出test和163.com。 //string email = "test@163.com"; //Match match = Regex.Match(email, @"(^\w+)@(\w+\.\w+)$"); //Console.WriteLine(match.Groups[1].Value + " " + match.Groups[2].Value); //Console.ReadKey(); #endregion #region 「192.168.10.5[port=21,type=ftp]」,這個字符串表示IP地址爲192.168.10.5的服務器的21端口提供的是ftp服務,其中若是「,type=ftp」部分被省略,則默認爲http服務。請用程序解析此字符串,而後打印出「IP地址爲***的服務器的***端口提供的服務爲***」 //string s1 = "192.168.10.5[port=21,type=ftp]"; ////string s1 = "192.168.10.5[port=21]"; //Match match = Regex.Match(s1, @"^((\d{1,3}\.){3}\d{1,3})\[port=(\d{1,2})(,type=([a-zA-Z0-9]+))?\]$", RegexOptions.ECMAScript); //Console.WriteLine("ip:{0}", match.Groups[1].Value); //Console.WriteLine("port:{0}", match.Groups[3]); //Console.WriteLine("service:{0}", match.Groups[5].Value.Length == 0 ? "http" : match.Groups[5].Value); //Console.ReadKey(); #endregion } } }
正則表達式-貪婪模式正則表達式
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Text.RegularExpressions; namespace _03貪婪模式 { class Program { static void Main(string[] args) { #region 貪婪模式介紹 //string msg = "1111。11。111。111111。"; ////正則表達式會盡量多的找到匹配,這就是正則表達式的貪婪模式。 ////Match match = Regex.Match(msg, ".+"); ////終止貪婪模式: ? 具備終止貪婪模式的功能。 ////當?出如今了另一個限定符後的時候,表示終止貪婪模式。 ////終止貪婪模式,表示,儘量少的去匹配,則只匹配一個。 //Match match = Regex.Match(msg, ".+?"); ////Match match = Regex.Match(msg, ".+*?"); //儘量少的匹配 0個 //Console.WriteLine(match.Value); //Console.ReadKey(); #endregion #region 案例1 ////string msg = "1111。11。111。111111。"; ////Match match = Regex.Match(msg, "(.+)(。)"); ////Console.WriteLine(match.Value); ////Console.WriteLine(match.Groups[1].Value + " " + match.Groups[2].Value); ////Console.ReadKey(); //string msg = "1111。11。111。111111。"; ////終止貪婪模式後的結果:1111。 //Match match = Regex.Match(msg, ".+?。"); //Console.WriteLine(match.Value); //Console.ReadKey(); #endregion #region 案例2 //string msg = "你們好。咱們是S.H.E。我是S。我是H。我是E。我是葉長種。我是劉德華。我是范冰冰。我是小王。我是N.L.L。我是★小葉★。嗚嗚。fffff"; ////正確結果: S H E 葉長種 劉德華 范冰冰 小王 N.L.L ★小葉★ ////當咱們但願找到多個匹配的時候,結果卻只找到了一個很大的匹配值,這個時候通常都是貪婪模式的問題,嘗試終結貪婪模式。 //MatchCollection matches = Regex.Matches(msg, "我是(.+?)。"); //foreach (Match item in matches) //{ // Console.WriteLine(item.Groups[1].Value); //} //Console.ReadKey(); #endregion } } }
正則表達式替換windows
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Text.RegularExpressions; namespace _04正則表達式替換 { class Program { static void Main(string[] args) { //string msg = "你aaa好aa哈哈a你"; //msg = msg.Replace("a", "A"); ////msg = Regex.Replace(msg, "a+", "A"); //Console.WriteLine(msg); //Console.ReadKey(); #region 練習1:將一段文本中的MM/DD/YYYY格式的日期轉換爲YYYY-MM-DD格式 ,好比「個人生日是05/21/2010耶」轉換爲「個人生日是2010-05-21耶」。 //string msg = "個人生日是05/21/2010耶個人生日是03/11/2000耶個人生日是05/21/2010耶個人生日是05/21/2010耶"; ////在替換的方法中,使用提取組。 注意在引用分組的時候是使用 $一、$二、..... //msg = Regex.Replace(msg, @"(\d{2})/(\d{2})/(\d{4})", "$3-$1-$2"); //Console.WriteLine(msg); //Console.ReadKey(); #endregion #region 將hello ‘welcome’ to ‘China’ 替換成 hello 【welcome】 to 【China】 ////hello 【welcome】 to 【China】 //string s = " hello 'welcome' to be'aut'iful 'China' fdsfds jfklds'jfdsk'lfjskl "; ////若是就想表示一個普通的$1,則須要$$1 //s = Regex.Replace(s, "'(.+?)'", "【$1】"); //Console.WriteLine(s); //Console.ReadKey(); #endregion #region 替換手機號的掩碼 //string msg = "個人手機號碼是13888888888 蘇坤的手機號是18999165365。長15210998254的以爲是浪費"; //msg = Regex.Replace(msg, @"(\d{3})\d{4}(\d{4})", "$1****$2"); //Console.WriteLine(msg); //Console.ReadKey(); ////string msg = "嘎哈發的睡覺了zxh@itcast.cn范德薩abcdef@yahoo.com范德薩nihaomahaha@sina.com.cn范德薩"; //////嘎哈發的睡覺了***@itcast.cn范德薩******@yahoo.com范德薩************@sina.com.cn范德薩 #endregion #region 練習2:給一段文本中匹配到的url添加超連接,好比把http://www.test.com替換爲<a href="http://www.test.com"> http://www.test.com</a>。參考代碼見備註。由於這個是總體作爲一個組,比較特殊,難以理解,先把日期轉換的理解了就好理解了。 //string msg = "新浪的網址是:http://www.sina.com.cn搜狐的網址是:http://www.sohu.com 還有網易的網址:http://www.163.com"; ////msg = Regex.Replace(msg, "([a-zA-Z0-9]+://[0-9a-zA-Z.&=\\?%]+)", "<a href=\"$1\">$1</a>"); //msg = Regex.Replace(msg, "([a-zA-Z0-9]+://[0-9a-zA-Z.&=\\?%]+)", @"<a href=""$1"">$1</a>"); //Console.WriteLine(msg); //Console.ReadKey(); ////新浪的網址是:<a href="http://www.sina.com.cn">http://www.sina.com.cn</a>搜狐的網址是:<a href="http://www.sohu.com">http://www.sohu.com<a>還有網易的網址:<a href="http://www.163.com">http://www.163.com</a> #endregion } } }
正則提取職位信息服務器
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Text.RegularExpressions; using System.IO; using System.Net; namespace _05經過WebClient類來發起請求並下載html { class Program { static void Main(string[] args) { #region 抓取網頁email //string url = "http://192.168.1.100:8080/提取Email.htm"; ////1.根據網址下載對應html字符串 //WebClient wc = new WebClient(); //wc.Encoding = Encoding.UTF8; //string html = wc.DownloadString("http://192.168.1.100:8080/提取Email.htm"); ////2.從下載到字符串中提取Email,並把提取到的Email寫入到文本文件中 //MatchCollection matches = Regex.Matches(html, @"[-a-zA-Z0-9_.]+@[-a-zA-Z0-9]+(\.[a-zA-Z0-9]+){1,}"); //using (StreamWriter writer = new StreamWriter("email.txt")) //{ // //遍歷提取到的email // foreach (Match item in matches) // { // //Console.WriteLine(item.Value); // writer.WriteLine(item.Value); // } //} //Console.ReadKey(); #endregion #region 抓取網頁圖片 //WebClient wc = new WebClient(); ////1.下載網頁源代碼 //string html = wc.DownloadString("http://image.haosou.com/i?src=360pic_strong&q=美女"); ////2.提取網頁中的圖片,其實就是<img>標籤 ////<img alt="" src="hotgirls/00_00.jpg" /> //MatchCollection matches = Regex.Matches(html, @"<img\s+alt="""" src=""(.+)""\s*/>"); //foreach (Match item in matches) //{ // string imgPath = "http://image.haosou.com/i?src=360pic_strong&q=美女" + item.Groups[1].Value; // //下載圖片 // wc.DownloadFile(imgPath, @"C:\Users\Administrator\Desktop\MV" + Path.GetFileName(imgPath)); //} //Console.WriteLine("ok"); //Console.ReadKey(); #endregion #region 抓取職位信息 //WebClient webClient = new WebClient(); //string html = webClient.DownloadString("http://192.168.1.100:8080/【上海,IT-管理,計算機軟件招聘,求職】-前程無憂.htm"); ////<a href="http://search.51job.com/job/46621778,c.html" onclick="zzSearch.acStatRecJob( 1 );" class="jobname" target="_blank">ERP項目經理</a> //MatchCollection matches = Regex.Matches(html, @"<a\s+href=""http://search.51job.com/job/[0-9]{8},c.html"".+>(.+)</a>"); //foreach (Match item in matches) //{ // Console.WriteLine(item.Groups[1].Value); //} //Console.WriteLine("共{0}個職位信息。", matches.Count); //Console.ReadKey(); #endregion } } }