C# LINQ學習筆記四:LINQ to OBJECT之操做文件目錄

    本筆記摘抄自:http://www.javashuo.com/article/p-hrgzvqpr-cc.html,記錄一下學習過程以備後續查用。html

    許多文件系統操做實質上是查詢,所以很是適合使用LINQ方法。正則表達式

    1、查詢具備指定屬性或名稱的文件緩存

    此示例演示如何查找指定目錄樹中具備指定文件擴展名(例如「.txt」)的全部文件,還演示如何根據建立時間返回樹中最新或最舊的文件。ide

    class Program
    {
        static void Main(string[] args)
        {
            #region LINQ 查詢具備指定屬性或名稱的文件
            //文件路徑
            const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\";
            //取文件系統快照
            var dir = new DirectoryInfo(path);
            //該方法假定應用程序在指定路徑下的全部文件夾都具備搜索權限
            var files = dir.GetFiles("*.*", SearchOption.AllDirectories);

            //建立查詢
            var qurey = from file in files
                            where file.Extension == ".txt"
                            orderby file.Name
                            select file;

            //執行查詢
            foreach (var file in qurey)
            {
                Console.WriteLine(file.FullName);
            }

            //建立和執行一個新的查詢,經過查詢舊文件的建立時間做爲一個出發點。
            //Last:選擇最後一個,由於是按日期升序,因此最新的是指向最後一個。
            var newestFile = (from file in qurey
                              orderby file.CreationTime
                              select new { file.FullName, file.CreationTime }).Last();

            Console.WriteLine($"\r\nThe newest .txt file is {newestFile.FullName}. Creation time: {newestFile.CreationTime}");
            Console.Read();
            #endregion
        }
    }
View Code

    運行結果以下:學習

    2、按照擴展名對文件進行分組spa

    此示例演示如何使用LINQ對文件或文件夾列表執行高級分組和排序操做。此外,它還演示如何使用Skip<TSource>和Take<TSource>方法對控制檯窗設計

口中的輸出進行分頁。code

    下面的查詢演示如何按文件擴展名對指定目錄樹的內容進行分組。orm

    class Program
    {
        static void Main(string[] args)
        {
            #region LINQ 按照擴展名對文件進行分組
            const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\Enterprise\Common7\";
            //「path」的長度,後續用於在輸出時去掉「path」這段前綴。
            var trimLength = path.Length;
            //取文件系統快照
            var dir = new DirectoryInfo(path);
            //該方法假定應用程序在指定路徑下的全部文件夾都具備搜索權限。
            var files = dir.GetFiles("*.*", SearchOption.AllDirectories);

            //建立查詢
            var query = from file in files
                        group file by file.Extension.ToLower() into fileGroup
                        orderby fileGroup.Key
                        select fileGroup;

            //一次顯示一組。若是列表實體的行數大於控制檯窗口中的行數,則分頁輸出。 
            PageOutput(trimLength, query);
            #endregion
        }

        /// <summary>
        /// 分頁輸出
        /// </summary>
        /// <param name="rootLength"></param>
        /// <param name="query"></param>
        private static void PageOutput(int rootLength, IOrderedEnumerable<IGrouping<string, FileInfo>> query)
        {
            //跳出分頁循環的標誌
            var isAgain = true;
            //控制檯輸出的高度
            var numLines = Console.WindowHeight - 3;

            //遍歷分組集合
            foreach (var g in query)
            {
                var currentLine = 0;

                do
                {
                    Console.Clear();
                    Console.WriteLine(string.IsNullOrEmpty(g.Key) ? "[None]" : g.Key);

                    //從「currentLine」開始顯示「numLines」條數
                    var resultPage = g.Skip(currentLine).Take(numLines);

                    //執行查詢
                    foreach (var info in resultPage)
                    {
                        Console.WriteLine("\t{0}", info.FullName.Substring(rootLength));
                    }

                    //記錄輸出行數
                    currentLine += numLines;
                    Console.WriteLine("點擊「任意鍵」繼續,按「End」鍵退出");

                    //給用戶選擇是否跳出
                    var key = Console.ReadKey().Key;
                    if (key != ConsoleKey.End) continue;

                    isAgain = false;
                    break;
                } while (currentLine < g.Count());

                if (!isAgain)
                {
                    break;
                }
            }
        }
    }
View Code

    運行結果以下:htm

    3、查詢一組文件夾中的總字節數

    此示例演示如何檢索指定文件夾及其全部子文件夾中的全部文件所使用的總字節數。

    Sum方法添加在select子句中選擇的全部項的值。您能夠輕鬆修改此查詢以檢索指定目錄樹中的最大或最小文件,方法是調用Min<TSource>或

Max<TSource>方法,而不是Sum。

    class Program
    {
        static void Main(string[] args)
        {
            #region LINQ 查詢一組文件夾中的總字節數
            const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\";
            var dir = new DirectoryInfo(path);
            var files = dir.GetFiles("*.*", SearchOption.AllDirectories);
            var query = from file in files
                        select file.Length;

            //緩存結果,以免屢次訪問文件系統
            var fileLengths = query as long[] ?? query.ToArray();
            //返回最大文件的大小 
            var largestLength = fileLengths.Max();
            //返回指定文件夾下的全部文件中的總字節數
            var totalBytes = fileLengths.Sum();
            Console.WriteLine();

            Console.WriteLine("There are {0} bytes in {1} files under {2}", totalBytes, files.Count(), path);
            Console.WriteLine("The largest files is {0} bytes.", largestLength);
            Console.Read();
            #endregion
        }
    }
View Code

    運行結果以下:

    4、比較兩個文件夾中的內容

    此示例演示比較兩個文件列表的三種方法:

    一、查詢一個指定兩個文件列表是否相同的布爾值。

    二、查詢用於檢索同時位於兩個文件夾中的文件的交集。

    三、查詢用於檢索位於一個文件夾中但不在另外一個文件夾中的文件的差集。

    /// <summary>
    /// 文件名和字節數比較類
    /// </summary>
    public class FileComparer : IEqualityComparer<FileInfo>
    {
        public bool Equals(FileInfo x, FileInfo y)
        {
            return string.Equals(x.Name, y.Name, StringComparison.CurrentCultureIgnoreCase) && x.Length == y.Length;
        }

        //返回一個比較標準的哈希值。根據IEqualityComparer規則,若是相等,那麼哈希值也必須是相等的。
        //由於這裏所定義的相等只是一個簡單的值相等,而不是引用標識,因此兩個或多個對象將產生相同的哈希值是可能的。 
        public int GetHashCode(FileInfo obj)
        {
            var s = string.Format("{0}{1}", obj.Name, obj.Length);
            return s.GetHashCode();
        }
    }

    class Program
    {
        static void Main(string[] args)
        {
            #region LINQ 查詢一組文件夾中的總字節數
            const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\";
            var dir = new DirectoryInfo(path);
            var files = dir.GetFiles("*.*", SearchOption.AllDirectories);
            var query = from file in files
                        select file.Length;

            //緩存結果,以免屢次訪問文件系統
            var fileLengths = query as long[] ?? query.ToArray();
            //返回最大文件的大小 
            var largestLength = fileLengths.Max();
            //返回指定文件夾下的全部文件中的總字節數
            var totalBytes = fileLengths.Sum();
            Console.WriteLine();

            Console.WriteLine("There are {0} bytes in {1} files under {2}", totalBytes, files.Count(), path);
            Console.WriteLine("The largest files is {0} bytes.", largestLength);
            Console.Read();
            #endregion
        }
    }
View Code

    運行結果以下:

    此處顯示的FileComparer類演示如何將自定義比較器類與標準查詢運算符一塊兒使用。該類不是爲在實際方案中使用而設計的,它只是使用每一個

文件的名稱和長度(以字節爲單位)來肯定每一個文件夾的內容是否相同。在實際方案中,應對此比較器進行修改以執行更嚴格的相等性檢查。

    5、在目錄樹中查詢最大的文件

    此示例演示與文件大小(以字節爲單位)相關的五種查詢:

    一、如何檢索最大文件的大小(以字節爲單位)。

    二、如何檢索最小文件的大小(以字節爲單位)。

    三、如何從指定的根文件夾下的一個或多個文件夾檢索FileInfo對象最大或最小文件。

    四、如何檢索一個序列,如10個最大文件。

    下面的示例包含五種不一樣的查詢,這些查詢演示如何根據文件大小(以字節爲單位)查詢和分組文件。能夠輕鬆地修改這些示例,以使查詢基

於FileInfo對象的某個其餘屬性。

    class Program
    {
        static void Main(string[] args)
        {
            #region LINQ 在目錄樹中查詢最大的文件
            const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\";
            var dir = new DirectoryInfo(path);
            var files = dir.GetFiles("*.*", SearchOption.AllDirectories);
            var query1 = from file in files
                         select file.Length;

            //返回最大文件的大小
            var maxSize = query1.Max();
            Console.WriteLine("The length of the largest file under {0} is {1}", path, maxSize);
            Console.WriteLine();

            //倒序排列
            var query2 = from file in files
                         let len = file.Length
                         where len > 0
                         orderby len descending
                         select file;

            var fileInfos = query2 as FileInfo[] ?? query2.ToArray();
            //倒序排列的第一個就是最大的文件
            var longestFile = fileInfos.First();
            //倒序排列的第一個就是最小的文件
            var smallestFile = fileInfos.Last();

            Console.WriteLine("The largest file under {0} is {1} with a length of {2} bytes", 
                path, longestFile.FullName, longestFile.Length);
            Console.WriteLine();

            Console.WriteLine("The smallest file under {0} is {1} with a length of {2} bytes", 
                path, smallestFile.FullName, smallestFile.Length);
            Console.WriteLine();

            Console.WriteLine("===== The 10 largest files under {0} are: =====", path);

            //返回前10個最大的文件
            var queryTenLargest = fileInfos.Take(10);
            foreach (var file in queryTenLargest)
            {
                Console.WriteLine("{0}: {1} bytes", file.FullName, file.Length);
            }
            Console.Read();
            #endregion
        }
    }
View Code

    運行結果以下:

    若要返回一個或多個完整的FileInfo對象,查詢必須首先檢查數據源中的每一個對象,而後按這些對象的Length屬性的值排序它們,這樣就能夠

返回具備最大長度的單個對象或序列。使用 First<TSource>可返回列表中的第一個元素使用 Take<TSource>可返回前n個元素。

    6、在目錄樹中查詢重複的文件

    有時,多個文件夾中可能存在同名的文件。例如,在Visual Studio安裝文件夾中,有多個文件夾包含readme.htm文件。

    此示例演示如何在指定的根文件夾中查詢重複文件名。

    class Program
    {
        static void Main(string[] args)
        {
            #region LINQ 在目錄樹中查詢重複的文件示例一
            const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\";
            var dir = new DirectoryInfo(path);
            var files = dir.GetFiles("*.*", SearchOption.AllDirectories);
            var charsToSkip = path.Length;

            var queryDupNames = (from file in files
                                 group file.FullName.Substring(charsToSkip) by file.Name into fileGroup
                                 where fileGroup.Count() > 1
                                 select fileGroup).Distinct();

            PageOutput(queryDupNames);
            #endregion
        }

        /// <summary>
        /// 分頁輸出
        /// </summary>
        /// <typeparam name="TK"></typeparam>
        /// <typeparam name="TV"></typeparam>
        /// <param name="queryDupNames"></param>
        private static void PageOutput<TK, TV>(IEnumerable<IGrouping<TK, TV>> queryDupNames)
        {
            //控制檯輸出的高度
            var numLines = Console.WindowHeight - 3;

            var dupNames = queryDupNames as IGrouping<TK, TV>[] ?? queryDupNames.ToArray();
            foreach (var queryDupName in dupNames)
            {
                //分頁開始
                var currentLine = 0;

                do
                {
                    Console.Clear();
                    Console.WriteLine("Filename = {0}", queryDupName.Key.ToString() == string.Empty ? "[none]" : queryDupName.Key.ToString());

                    //跳過currentLine行,取numLines行。
                    var resultPage = queryDupName.Skip(currentLine).Take(numLines);

                    foreach (var fileName in resultPage)
                    {
                        Console.WriteLine("\t{0}", fileName);
                    }

                    //增量器記錄已顯示的行數
                    currentLine += numLines;

                    //按得有點累,仍是讓它自動下一頁吧。
                    Thread.Sleep(100);

                } while (currentLine < queryDupName.Count());
            }
        }
    }
View Code

    運行結果以下:

    此示例演示如何查詢其大小和建立時間也匹配的文件。

    /// <summary>
    /// PortableKey類
    /// </summary>
    public class PortableKey
    {
        public string Name { get; set; }
        public DateTime CreationTime { get; set; }
        public double Length { get; set; }
    }

    class Program
    {
        static void Main(string[] args)
        {
            #region LINQ 在目錄樹中查詢重複的文件示例二
            const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\";
            var dir = new DirectoryInfo(path);
            var files = dir.GetFiles("*.*", SearchOption.AllDirectories);
            var charsToSkip = path.Length;

            //注意一個複合鍵的使用,三個屬性都匹配的文件屬於同一組。
            //匿名類型也能夠用於複合鍵,但不能跨越方法邊界。 
            var queryDupFiles = from file in files
                                group file.FullName.Substring(charsToSkip) by
                                    new PortableKey() { Name = file.Name, CreationTime = file.CreationTime, Length = file.Length } into fileGroup
                                where fileGroup.Count() > 1
                                select fileGroup;

            var queryDupNames = queryDupFiles as IGrouping<PortableKey, string>[] ?? queryDupFiles.ToArray();
            var list = queryDupNames.ToList();
            var count = queryDupNames.Count();

            //分頁輸出
            PageOutput(queryDupNames);
            Console.Read();
            #endregion
        }

        /// <summary>
        /// 分頁輸出
        /// </summary>
        /// <typeparam name="TK"></typeparam>
        /// <typeparam name="TV"></typeparam>
        /// <param name="queryDupNames"></param>
        private static void PageOutput<TK, TV>(IEnumerable<IGrouping<TK, TV>> queryDupNames)
        {
            //控制檯輸出的高度
            var numLines = Console.WindowHeight - 3;

            var dupNames = queryDupNames as IGrouping<TK, TV>[] ?? queryDupNames.ToArray();
            foreach (var queryDupName in dupNames)
            {
                //分頁開始
                var currentLine = 0;

                do
                {
                    Console.Clear();
                    Console.WriteLine("Filename = {0}", queryDupName.Key.ToString() == string.Empty ? "[none]" : queryDupName.Key.ToString());

                    //跳過currentLine行,取numLines行。
                    var resultPage = queryDupName.Skip(currentLine).Take(numLines);

                    foreach (var fileName in resultPage)
                    {
                        Console.WriteLine("\t{0}", fileName);
                    }

                    //增量器記錄已顯示的行數
                    currentLine += numLines;

                    //按得有點累,仍是讓它自動下一頁吧。
                    Thread.Sleep(100);

                } while (currentLine < queryDupName.Count());
            }
        }
    }
View Code

    7、在文件夾中查詢文件的內容

    此示例演示如何查詢指定目錄樹中的全部文件、打開每一個文件並檢查其內容。 此類技術可用於對目錄樹的內容建立索引或反向索引。 此示例

雖然執行的是簡單的字符串搜索,可是,可以使用正則表達式執行更復雜類型的模式匹配。

    class Program
    {
        static void Main(string[] args)
        {
            #region LINQ 在文件夾中查詢文件的內容
            const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\";
            var dir = new DirectoryInfo(path);
            var files = dir.GetFiles("*.*", SearchOption.AllDirectories);

            //待匹配的字符串
            const string searchTerm = @"Visual Studio";
            //搜索每一個文件的內容。
            //您也可使用正則表達式替換Contains方法
            var queryMatchingFiles = from file in files
                                     where file.Extension == ".html"
                                     let content = GetFileConetnt(file.FullName)
                                     where content.Contains(searchTerm)
                                     select file.FullName;

            //執行查詢
            Console.WriteLine("The term \"{0}\" was found in:", searchTerm);
            foreach (var filename in queryMatchingFiles)
            {
                Console.WriteLine(filename);
            }
            Console.Read();
            #endregion
        }

        /// <summary>
        /// 讀取文件的全部內容
        /// </summary>
        /// <param name="fileName"></param>
        /// <returns></returns>
        static string GetFileConetnt(string fileName)
        {
            //若是咱們在快照後已刪除該文件,則忽略它,並返回空字符串。 
            return File.Exists(fileName) ? File.ReadAllText(fileName) : "";
        }
    }
View Code

    運行結果以下:

相關文章
相關標籤/搜索