10---Net基礎增強

複習:html

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Text.RegularExpressions;
using System.Runtime.Serialization.Formatters.Binary;
using System.IO;

namespace _01做業問題
{
    class Program
    {
        static void Main(string[] args)
        {
            #region 正則
            //Regex regex = new Regex(@"^\d{6}$", RegexOptions.ECMAScript);
            //while (true)
            //{
            //    Console.WriteLine("請輸入一個字符串");
            //    string postcode = Console.ReadLine();
            //    bool b = regex.IsMatch(postcode);
            //    Console.WriteLine(b);
            //}           
            #endregion

            #region 二進制序列化的步驟
           
           // //建立一個二進制序列化器
           // BinaryFormatter bf = new BinaryFormatter();
          
           //using (FileStream fsWrite = File.OpenWrite("data"))
           //{
           //    //2.執行序列化或者反序列化
           //    //調用序列化的時候,須要傳遞兩個參數,一個是流,另外一個是須要序列化的對象
           //    bf.Serialize(fsWrite,new MyClass());
           //}

           //Console.WriteLine("OK");

            #endregion

            #region 二進制反序列化的步驟

            //BinaryFormatter bf = new BinaryFormatter();

            //using (FileStream fsRead = File.OpenRead("data"))
            //{
            //    object obj = bf.Deserialize(fsRead);
            //    MyClass mc = obj as MyClass;
            //}

            //Console.WriteLine("OK");

            #endregion

            #region MyRegion
            //while (true)
            //{
            //    Console.WriteLine("請輸入一個字符串");
            //    string input = Console.ReadLine();

            //    ////表示只有用戶輸入一個數字字符的時候才返回true
            //    //bool b = Regex.IsMatch(input,"^\\d$");

            //    //表示只有用戶輸入\d的時候返回true,不然輸入其它內容都返回false
            //    //bool b = Regex.IsMatch(input, "^\\\\d$");
            //    bool b = Regex.IsMatch(input, @"^\\d$");
            //    Console.WriteLine(b);
            //}  
            #endregion

            #region 匹配IP地址,4段用.分割的最多的三位數字。192.168.54.7七、333.333.333.333假設都是正確的
            //while (true)
            //{
            //    Console.WriteLine("請輸入一個字符串");
            //    string ip = Console.ReadLine();
            //    bool b = Regex.IsMatch(ip, @"^(\d{1,3}\.){3}\d{1,3}$",RegexOptions.ECMAScript);
            //    Console.WriteLine(b);
            //}  
            #endregion

            #region 判斷是不是合法的日期「2008-08-08」.四位數字-兩位數字-兩位數字
            //while (true)
            //{
            //    Console.WriteLine("請輸入日期");
            //    string date = Console.ReadLine();
            //    //bool b = Regex.IsMatch(date, @"^\d{4}-\d{2}-\d{2}$", RegexOptions.ECMAScript);
            //    bool b = Regex.IsMatch(date, @"^\d{4}-(0[1-9]|1[0-2])-\d{2}$", RegexOptions.ECMAScript);
            //    Console.WriteLine(b);
            //}  
            #endregion

            #region 判斷是不是合法的url地址
            //while (true)
            //{
            //    Console.WriteLine("請輸入");
            //    string url = Console.ReadLine();
            //    bool b = Regex.IsMatch(url, @"^[a-zA-Z0-9]+://.+$");
            //    Console.WriteLine(b);
            //}  
            #endregion
        }
    }

    [Serializable]
    class MyClass
    { 
    
    }
}

 

字符串提取與正則表達式提取-提取組 web

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Text.RegularExpressions;
using System.IO;

namespace _02正則表達式提取
{
    class Program
    {
        static void Main(string[] args)
        {
            #region 提取出字符串中的全部數字

            //string msg = "你們好呀,hello,2015年 3月30日是個好日子,恩恩 9494,吼吼886";

            ////字符串提取 Match()和 Matches()
            ////提取第一個匹配的字符串,只提取一個。
            ////Match match = Regex.Match(msg, @"\d", RegexOptions.ECMAScript);//2
            //Match match = Regex.Match(msg, @"\d+", RegexOptions.ECMAScript);//2015
            //Console.WriteLine(match.Value);
            //Console.ReadLine();

            ////逐個提取
            ////Match match1 = Regex.Match(msg, @"\d+", RegexOptions.ECMAScript);//2015
            ////match1.Index=
            ////Console.WriteLine(match1.Value);
            //Regex regex = new Regex(@"\d+", RegexOptions.ECMAScript);
            //Match match = regex.Match(msg);
            //Console.WriteLine(match.Value);

            //match = regex.Match(msg,match.Index+match.Value.Length);
            //Console.WriteLine(match.Value);

            //match = regex.Match(msg, match.Index + match.Value.Length);
            //Console.WriteLine(match.Value);
            //Console.ReadLine();


            ////逐個提取
            ////通常在調用IsMatch()的時候要判斷徹底匹配,因此要加^$
            ////可是在Match()和 Matches()的時候,是要從一個大字符串中提取某一部分匹配的內同因此不能加^$
            ////若是加了,則必須整個大字符串與給定的正則表達式徹底匹配
            //Regex regex = new Regex(@"\d+", RegexOptions.ECMAScript);
            //Match match = regex.Match(msg);
            //while (match.Value.Length!=0)
            //{
            //     Console.WriteLine(match.Value);
            //     match = regex.Match(msg, match.Index + match.Value.Length);
            //}
            //Console.ReadLine();


            ////提取全部匹配的字符串
            // MatchCollection matches = Regex.Matches(msg, @"\d+", RegexOptions.ECMAScript);
            // for (int i = 0; i < matches.Count; i++)
            // {
            //     Console.WriteLine(matches[i].Value); 
            // }
            // Console.ReadLine();

            //判斷是否匹配
            //Regex.IsMatch()

            #endregion

            #region 從文件中提取Email地址

            ////1.讀取文件中的內容到字符串
            //string html = File.ReadAllText("提取Email.htm");

            ////2.建立正則表達式
            //MatchCollection matches = Regex.Matches(html, @"[-a-zA-Z0-9._]+@[-a-zA-Z0-9]+(\.[a-zA-Z0-9]+){1,}", RegexOptions.ECMAScript);

            ////3.進行提取
            //for (int i = 0; i < matches.Count; i++)
            //{

            //    //4.輸出
            //    Console.WriteLine(matches[i].Value);
            //}
            //Console.ReadLine();
          
            #endregion

            #region 統計葉長種個數

            //string msg = "你們好哦,我叫葉長種,葉長種是個好孩子,哈哈哈哈哈哈·····你有認識叫葉長種的嗎";

            //MatchCollection matches = Regex.Matches(msg, "葉長種");

            //foreach (Match item in matches)
            //{
            //    Console.WriteLine(item.Index);
            //}
            //Console.WriteLine("一共出現了{0}次",matches.Count);
            //Console.ReadLine();

            #endregion

            #region 字符串提取

            ////1.從一個大字符串中提取 某一部分字符串

            ////2.在提取到的字符串中,在提取其中的某部分
            ////提取組

            ////1.讀取文件中的內容到字符串
            //string html = File.ReadAllText("提取Email.htm");

            ////2.建立正則表達式
            //MatchCollection matches = Regex.Matches(html, @"[-a-zA-Z0-9._]+@[-a-zA-Z0-9]+(\.[a-zA-Z0-9]+){1,}", RegexOptions.ECMAScript);

            ////()()(()()) 按照括號來分組
            //foreach (Match item in matches)
            //{
            //    Console.WriteLine(item.Value+"================"+item.Groups[1].Value);
            //}
            //Console.WriteLine(matches.Count);
            //Console.ReadLine();

            #endregion

            #region 提取組2

            //Match match = Regex.Match("age=30",@"^(.+)=(.+)$");
            //Console.WriteLine(match.Groups[1].Value+"============="+match.Groups[2].Value);
            //Console.ReadKey();
            
            #endregion

            #region 從文件路徑中提取文件名

            ////普通的字符串提取:Match().Matches(),思路是從整個字符串中找出全部那些匹配正則表達式的字符串

            ////提取組的思路:先寫一個能知足整個字符串的正則表達式,而後再正則表達式中用括號講那些你想要提取的內容擴起來
            ////這樣就能夠提取你想要的組了

            //string path = @"c:\windows\testb.txt";
            //Match match=Regex.Match(path, @".+\\(.+)");
            //Console.WriteLine(match.Groups[1].Value);
            //Console.ReadKey();

            #endregion

            #region 提取年月日

            //string msg = "June          26    ,   1951   ";
            //Match match = Regex.Match(msg,@"^([a-zA-Z]+)\s*(\d{1,2})\s*,\s*(\d{4})\s*$");
            //Console.WriteLine(match.Groups[1].Value);
            //Console.WriteLine(match.Groups[2].Value);
            //Console.WriteLine(match.Groups[3].Value);
            //Console.ReadKey();

            #endregion

            #region 從Email中提取出用戶名和域名,好比從test@163.com中提取出test和163.com。

            //string email = "test@163.com";
            //Match match = Regex.Match(email, @"(^\w+)@(\w+\.\w+)$");
            //Console.WriteLine(match.Groups[1].Value + "         " + match.Groups[2].Value);
            //Console.ReadKey();

            #endregion


            #region 「192.168.10.5[port=21,type=ftp]」,這個字符串表示IP地址爲192.168.10.5的服務器的21端口提供的是ftp服務,其中若是「,type=ftp」部分被省略,則默認爲http服務。請用程序解析此字符串,而後打印出「IP地址爲***的服務器的***端口提供的服務爲***」

            //string s1 = "192.168.10.5[port=21,type=ftp]";
            ////string s1 = "192.168.10.5[port=21]";

            //Match match = Regex.Match(s1, @"^((\d{1,3}\.){3}\d{1,3})\[port=(\d{1,2})(,type=([a-zA-Z0-9]+))?\]$", RegexOptions.ECMAScript);
            //Console.WriteLine("ip:{0}", match.Groups[1].Value);
            //Console.WriteLine("port:{0}", match.Groups[3]);
            //Console.WriteLine("service:{0}", match.Groups[5].Value.Length == 0 ? "http" : match.Groups[5].Value);
            //Console.ReadKey();

            #endregion


        }
    }
}

  

 正則表達式-貪婪模式正則表達式

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Text.RegularExpressions;

namespace _03貪婪模式
{
    class Program
    {
        static void Main(string[] args)
        {
            #region 貪婪模式介紹

            //string msg = "1111。11。111。111111。";

            ////正則表達式會盡量多的找到匹配,這就是正則表達式的貪婪模式。
            ////Match match = Regex.Match(msg, ".+");

            ////終止貪婪模式:  ? 具備終止貪婪模式的功能。
            ////當?出如今了另一個限定符後的時候,表示終止貪婪模式。
            ////終止貪婪模式,表示,儘量少的去匹配,則只匹配一個。
            //Match match = Regex.Match(msg, ".+?");  
            ////Match match = Regex.Match(msg, ".+*?");  //儘量少的匹配 0個
            //Console.WriteLine(match.Value);
            //Console.ReadKey();

            #endregion

            #region 案例1

            ////string msg = "1111。11。111。111111。";
            ////Match match = Regex.Match(msg, "(.+)(。)");
            ////Console.WriteLine(match.Value);
            ////Console.WriteLine(match.Groups[1].Value + "       " + match.Groups[2].Value);
            ////Console.ReadKey();

            //string msg = "1111。11。111。111111。";
            ////終止貪婪模式後的結果:1111。
            //Match match = Regex.Match(msg, ".+?。");
            //Console.WriteLine(match.Value);
            //Console.ReadKey();

            #endregion

            #region 案例2

            //string msg = "你們好。咱們是S.H.E。我是S。我是H。我是E。我是葉長種。我是劉德華。我是范冰冰。我是小王。我是N.L.L。我是★小葉★。嗚嗚。fffff";

            ////正確結果: S    H   E    葉長種   劉德華   范冰冰   小王  N.L.L   ★小葉★

            ////當咱們但願找到多個匹配的時候,結果卻只找到了一個很大的匹配值,這個時候通常都是貪婪模式的問題,嘗試終結貪婪模式。
            //MatchCollection matches = Regex.Matches(msg, "我是(.+?)。");
            //foreach (Match item in matches)
            //{
            //    Console.WriteLine(item.Groups[1].Value);
            //}
            //Console.ReadKey();

            #endregion


        }
    }
}

 

正則表達式替換windows

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Text.RegularExpressions;

namespace _04正則表達式替換
{
    class Program
    {
        static void Main(string[] args)
        {
            //string msg = "你aaa好aa哈哈a你";
            //msg = msg.Replace("a", "A");
            ////msg = Regex.Replace(msg, "a+", "A");
            //Console.WriteLine(msg);
            //Console.ReadKey();

            #region 練習1:將一段文本中的MM/DD/YYYY格式的日期轉換爲YYYY-MM-DD格式 ,好比「個人生日是05/21/2010耶」轉換爲「個人生日是2010-05-21耶」。

            //string msg = "個人生日是05/21/2010耶個人生日是03/11/2000耶個人生日是05/21/2010耶個人生日是05/21/2010耶";
            ////在替換的方法中,使用提取組。 注意在引用分組的時候是使用  $一、$二、.....
            //msg = Regex.Replace(msg, @"(\d{2})/(\d{2})/(\d{4})", "$3-$1-$2");
            //Console.WriteLine(msg);
            //Console.ReadKey();

            #endregion

            #region  將hello ‘welcome’ to ‘China’   替換成 hello 【welcome】 to 【China】

            ////hello 【welcome】 to 【China】
            //string s = " hello 'welcome' to  be'aut'iful 'China' fdsfds jfklds'jfdsk'lfjskl ";
            ////若是就想表示一個普通的$1,則須要$$1
            //s = Regex.Replace(s, "'(.+?)'", "【$1】");
            //Console.WriteLine(s);
            //Console.ReadKey();

            #endregion

            #region 替換手機號的掩碼

            //string msg = "個人手機號碼是13888888888 蘇坤的手機號是18999165365。長15210998254的以爲是浪費";
            //msg = Regex.Replace(msg, @"(\d{3})\d{4}(\d{4})", "$1****$2");
            //Console.WriteLine(msg);
            //Console.ReadKey();

            ////string msg = "嘎哈發的睡覺了zxh@itcast.cn范德薩abcdef@yahoo.com范德薩nihaomahaha@sina.com.cn范德薩";
            //////嘎哈發的睡覺了***@itcast.cn范德薩******@yahoo.com范德薩************@sina.com.cn范德薩
            #endregion

              #region 練習2:給一段文本中匹配到的url添加超連接,好比把http://www.test.com替換爲<a href="http://www.test.com"> http://www.test.com</a>。參考代碼見備註。由於這個是總體作爲一個組,比較特殊,難以理解,先把日期轉換的理解了就好理解了。

            //string msg = "新浪的網址是:http://www.sina.com.cn搜狐的網址是:http://www.sohu.com 還有網易的網址:http://www.163.com";
            ////msg = Regex.Replace(msg, "([a-zA-Z0-9]+://[0-9a-zA-Z.&=\\?%]+)", "<a href=\"$1\">$1</a>");
            //msg = Regex.Replace(msg, "([a-zA-Z0-9]+://[0-9a-zA-Z.&=\\?%]+)", @"<a href=""$1"">$1</a>");
            //Console.WriteLine(msg);
            //Console.ReadKey();

            ////新浪的網址是:<a href="http://www.sina.com.cn">http://www.sina.com.cn</a>搜狐的網址是:<a href="http://www.sohu.com">http://www.sohu.com<a>還有網易的網址:<a href="http://www.163.com">http://www.163.com</a>

            #endregion

        }
    }
}

 

 正則提取職位信息服務器

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Text.RegularExpressions;
using System.IO;
using System.Net;

namespace _05經過WebClient類來發起請求並下載html
{
    class Program
    {
        static void Main(string[] args)
        {
            #region 抓取網頁email
            //string url = "http://192.168.1.100:8080/提取Email.htm";
            ////1.根據網址下載對應html字符串
            //WebClient wc = new WebClient();
            //wc.Encoding = Encoding.UTF8;
            //string html = wc.DownloadString("http://192.168.1.100:8080/提取Email.htm");
            ////2.從下載到字符串中提取Email,並把提取到的Email寫入到文本文件中
            //MatchCollection matches = Regex.Matches(html, @"[-a-zA-Z0-9_.]+@[-a-zA-Z0-9]+(\.[a-zA-Z0-9]+){1,}");

            //using (StreamWriter writer = new StreamWriter("email.txt"))
            //{
            //    //遍歷提取到的email
            //    foreach (Match item in matches)
            //    {
            //        //Console.WriteLine(item.Value);
            //        writer.WriteLine(item.Value);
            //    }
            //}
            //Console.ReadKey();
            #endregion

            #region 抓取網頁圖片

            //WebClient wc = new WebClient();
            ////1.下載網頁源代碼
            //string html = wc.DownloadString("http://image.haosou.com/i?src=360pic_strong&q=美女");
            ////2.提取網頁中的圖片,其實就是<img>標籤
            ////<img alt="" src="hotgirls/00_00.jpg" />
            //MatchCollection matches = Regex.Matches(html, @"<img\s+alt="""" src=""(.+)""\s*/>");
            //foreach (Match item in matches)
            //{
            //    string imgPath = "http://image.haosou.com/i?src=360pic_strong&q=美女" + item.Groups[1].Value;
            //    //下載圖片
            //    wc.DownloadFile(imgPath, @"C:\Users\Administrator\Desktop\MV" + Path.GetFileName(imgPath));
            //}
            //Console.WriteLine("ok");
            //Console.ReadKey();

            #endregion


            #region 抓取職位信息

            //WebClient webClient = new WebClient();
            //string html = webClient.DownloadString("http://192.168.1.100:8080/【上海,IT-管理,計算機軟件招聘,求職】-前程無憂.htm");

            ////<a href="http://search.51job.com/job/46621778,c.html" onclick="zzSearch.acStatRecJob( 1 );" class="jobname" target="_blank">ERP項目經理</a>
            //MatchCollection matches = Regex.Matches(html, @"<a\s+href=""http://search.51job.com/job/[0-9]{8},c.html"".+>(.+)</a>");
            //foreach (Match item in matches)
            //{
            //    Console.WriteLine(item.Groups[1].Value);
            //}
            //Console.WriteLine("共{0}個職位信息。", matches.Count);
            //Console.ReadKey();

            #endregion


        }
    }
}
相關文章
相關標籤/搜索