C# 多線程小試牛刀

前言

昨天在上班時瀏覽博問,發現了一個問題,雖然本身在 C# 多線程上沒有怎麼嘗試過,看了幾遍 CLR 中關於 線程的概念和講解(後面三章)。也想拿來實踐實踐。問題定義是這樣的:git

對於多線程不是很懂,面試的時候遇到一個多線程的題,不會作,分享出來,懂的大佬指點一下,謝謝github

建一個winform窗體,在窗體中放上一個開始按鈕,一箇中止按鈕,一個文本框,在窗體中聲明一個List 類型的屬性,點擊開始按鈕後開啓10個線程,全部線程同時不間斷的給List 集合中添加1-10000之間的隨機數,要求添加List 集合中的數字不能重複,而且實時在文本框中顯示集合的長度,當集合List 的長度等於1000時自動中止全部線程,若是中途點擊中止按鈕也中止全部線程,點擊開始又繼續執行。 面試

我其實沒有徹底實現了這位博問中提問的同窗的需求,具體問題的來源可查看該地址 問題來源數組

開始嘗試

剛拿到這個需求的時候,映入我腦海裏的是 Task, Threadpool,Concurrent,和 Lock 等概念,接下來就是組裝和編碼的過程了,首先理一理頭緒,多線程

  • 生成隨機數
  • 插入到 List 中,且不能重複
  • 開啓多個線程同時插入。

首先是生成 隨機數,使用 System.Random 類來生成僞隨機數(這個其實性能和效率賊低,後面再敘述)併發

private int GenerateInt32Num()
{
    var num = random.Next(0, TOTAL_NUM);
    return num;
}

而後是插入到 List<Int32> 中的代碼,判斷是否 已經達到了 咱們須要的 List 長度,若是已知足,則退出程序。dom

private void AddToList(int num)
{
    if (numList.Count == ENDNUM)
    {
        return;
    }

    numList.Add(num);
}

若是是個 單線程的,按照上面那樣 while(true) 而後一直插入便可,可這個是個 多線程,那麼須要如何處理呢?性能

我思考了一下,想到了以前在 CLR 中學到的 能夠用 CancellationTokenSource 中的 Cancel 來通知 Task 來取消操做。因此如今的邏輯是,用線程池來實現多線程。而後傳入 CancellationTokenSource.Token 來取消任務。this

最後用 Task.WhanAny() 來獲取到第一個到達此 Task 的 ID。編碼

首先是創建 Task[] 的數組

internal void DoTheCompeteSecond()
{
    Task[] tasks = new Task[10];

    for (int i = 0; i < 10; ++i)
    {
        int num = i;
        tasks[i] = Task.Factory.StartNew(() => AddNumToList(num, cts), cts.Token);
    }

    Task.WaitAny(tasks);
}

而後 AddNumToList 方法是這樣定義的,

private void AddNumToList(object state, CancellationTokenSource cts)
{-
    Console.WriteLine("This is the {0} thread,Current ThreadId={1}",
                      state,
                      Thread.CurrentThread.ManagedThreadId);

    while (!cts.Token.IsCancellationRequested)
    {
        if (GetTheListCount() == ENDNUM)
        {
            cts.Cancel();
            Console.WriteLine("Current Thread Id={0},Current Count={1}",
                              Thread.CurrentThread.ManagedThreadId,
                              GetTheListCount());

            break;
        }
        var insertNum = GenerateInt32Num();
        if (numList.Contains(insertNum))
        {
            insertNum = GenerateInt32Num();
        }

        AddToList(insertNum);
    }
}

看起來是沒有什麼問題的,運行了一下。獲得了以下結果,

這應該是昨晚運行時獲得的數據,當時也沒有多想,就貼了上去,回答了那位提問同窗的問題。可是內心有一個疑惑,爲何會同時由 兩個 Thread 同時達到了該目標呢?

發現問題

今天早上到公司時,我又打開了這個 代碼,發現確實有點不對勁,因而就和我邊上 作 Go 語言開發的同窗,問了問他,哪裏出現了問題,他和我說:「你加了讀寫鎖了嗎?」 你這裏有數據髒讀寫。內心面有了點眉目。

按照他說的,修改了一下AddToList 裏面的邏輯,這時候,確實解決了上面的問題,

private void AddToList(int num)
{
    rwls.EnterReadLock();
    if (numList.Count == ENDNUM)
        return;
    rwls.ExitReadLock();

    rwls.EnterWriteLock();
    numList.Add(num);
    rwls.ExitWriteLock();
}

獲得的結果以下:

完整的代碼以下所示:

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Diagnostics;
using System.Threading;
using System.Threading.Tasks;

namespace CSharpFundamental
{
    class MultipleThreadCompete
    {
        List<int> numList = new List<int>();
        Random random = new Random();
        CancellationTokenSource cts = new CancellationTokenSource();
        private const int ENDNUM = 1000000;

        ReaderWriterLockSlim rwls = new ReaderWriterLockSlim();

        internal void DoTheCompeteSecond()
        {
            Stopwatch sw = new Stopwatch();
            sw.Start();
            Task[] tasks = new Task[100];

            for (int i = 0; i < 100; ++i)
            {
                int num = i;
                tasks[i] = Task.Run(() => AddNumToList(num, cts), cts.Token);
            }

            Task.WaitAny(tasks);

            Console.WriteLine("ExecuteTime={0}", sw.ElapsedMilliseconds / 1000);
        }

        private int GetTheListCount()
        {
            return numList.Count;
        }

        private void AddToList(int num)
        {
            rwls.EnterReadLock();
            if (numList.Count == ENDNUM)
                return;
            rwls.ExitReadLock();

            rwls.EnterWriteLock();
            numList.Add(num);
            rwls.ExitWriteLock();
        }

        private void AddNumToList(object state, CancellationTokenSource cts)
        {
            Console.WriteLine("This is the {0} thread,Current ThreadId={1}",
                state,
                Thread.CurrentThread.ManagedThreadId);

            while (!cts.Token.IsCancellationRequested)
            {
                try
                {
                    rwls.EnterReadLock();
                    if (numList.Count == ENDNUM)
                    {
                        cts.Cancel();
                        Console.WriteLine("Current Thread Id={0},Current Count={1}",
                            Thread.CurrentThread.ManagedThreadId,
                            GetTheListCount());
                        break;
                    }
                }
                finally
                {
                    rwls.ExitReadLock();
                }

                var insertNum = GenerateInt32Num();
                if (numList.Contains(insertNum))
                {
                    insertNum = GenerateInt32Num();
                }

                AddToList(insertNum);
            }
        }

        private int GenerateInt32Num()
        {
            return random.Next(1, ENDNUM);
        }
    }
}

這時候,那位 Go 語言的同窗和我說,咱們試試 1000w 的數據插入,看看須要多少時間?因而我讓他用 Go 語言實現了一下上面的邏輯,1000w數據用了 三分鐘,我讓他看看總共生成了多少隨機數,他查看了一下生成了 1億4千多萬的數據。

最開始我用上面的代碼來測,發現我插入 1000w 的數據,CPU 到100% 並且花了挺長時間,程序根本沒反應,查看了一下我判斷重複的語句numList.Contains()

底層實現的代碼爲:

[__DynamicallyInvokable]
    public bool Contains(T item)
    {
        if ((object) item == null)
        {
            for (int index = 0; index < this._size; ++index)
            {
                if ((object) this._items[index] == null)
                    return true;
            }
            return false;
        }
        EqualityComparer<T> equalityComparer = EqualityComparer<T>.Default;
        for (int index = 0; index < this._size; ++index)
        {
            if (equalityComparer.Equals(this._items[index], item))
                return true;
        }
        return false;
    }

可想而知,若是數據量很大的話,這個循環不就 及其緩慢嗎?

我因而請教了那位 GO 的同窗,判斷重複的邏輯用什麼來實現的,他和我說了一個位圖 bitmap 的概念,

我用其重寫了一下判斷重複的邏輯,代碼以下:

int[] bitmap = new int[MAX_SIZE];

var index = num % TOTAL_NUM;
bitMap[index] = 1;

return bitMap[num] == 1;

在添加到 List 的時候,順便插入到 bitmap 中,判斷重複只須要根據當前元素的位置是否 等於 1 便可,

我修改代碼後,跑了一下 1000w 的數據用來 3000+ ms。

這時候,引發了他的極度懷疑,一貫以高性能併發 著稱的 Go 速度居然這麼慢嗎?他一度懷疑個人邏輯有問題。

下午結束了一個階段的工做後,我又拾起了我上午寫的代碼,果不其然,發現了邏輯錯誤:

以下:

var insertNum = GenerateInt32Num();
if (numList.Contains(insertNum))
{
    insertNum = GenerateInt32Num();
}

生成隨機數這裏,這裏有個大問題,就是其實只判斷了一次,致使速度那麼快,正確的寫法應該是

while (ContainsNum(currentNum))
{
    currentNum = GenerateInt32Num();
}

private int GenerateInt32Num()
{
    var num = random.Next(0, TOTAL_NUM);
    //Console.WriteLine(num);

    return num;
}

最後的代碼以下:

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Threading;
using System.Threading.Tasks;

namespace CSharpFundamental
{
    class MultipleThreadCompete
    {
        List<int> numList = new List<int>();
        Random random = new Random();
        CancellationTokenSource cts = new CancellationTokenSource();
        private const int TOTAL_NUM = 1000000;
        private const int CURRENT_THREAD_COUNT = 35;

        ReaderWriterLockSlim rwls = new ReaderWriterLockSlim();

        int[] bitMap = new int[TOTAL_NUM];

        internal void DoTheCompete()
        {
            //ThreadPool.SetMinThreads(CURRENT_THREAD_COUNT, CURRENT_THREAD_COUNT);
            Stopwatch sw = new Stopwatch();
            sw.Start();
            Task[] tasks = new Task[CURRENT_THREAD_COUNT];

            for (int i = 0; i < CURRENT_THREAD_COUNT; ++i)
            {
                int num = i;
                tasks[i] = Task.Run(() => ExecuteTheTask(num, cts), cts.Token);
            }

            Task.WaitAny(tasks);

            Console.WriteLine("ExecuteTime={0}", sw.ElapsedMilliseconds);
        }

        private int GetTheListCount()
        {
            return numList.Count;
        }

        private void AddToList(int num)
        {
            if (numList.Count == TOTAL_NUM)
                return;
            numList.Add(num);

            var index = num % TOTAL_NUM;
            bitMap[index] = 1;
        }

        private void ExecuteTheTask(object state, CancellationTokenSource cts)
        {
            Console.WriteLine("This is the {0} thread,Current ThreadId={1}",
                state,
                Thread.CurrentThread.ManagedThreadId);

            while (!cts.Token.IsCancellationRequested)
            {
                try
                {
                    rwls.EnterReadLock();
                    if (numList.Count == TOTAL_NUM)
                    {
                        cts.Cancel();
                        Console.WriteLine("Current Thread Id={0},Current Count={1}",
                            Thread.CurrentThread.ManagedThreadId,
                            GetTheListCount());
                        break;
                    }
                }
                finally
                {
                    rwls.ExitReadLock();
                }

                var currentNum = GenerateInt32Num();

                while (ContainsNum(currentNum))
                {
                    currentNum = GenerateInt32Num();
                }

                rwls.EnterWriteLock();
                AddToList(currentNum);
                rwls.ExitWriteLock();
            }
        }

        private int GenerateInt32Num()
        {
            var num = random.Next(0, TOTAL_NUM);
            //Console.WriteLine(num);

            return num;
        }

        private bool ContainsNum(int num)
        {
            rwls.EnterReadLock();
            var contains = bitMap[num] == 1;
            rwls.ExitReadLock();

            return contains;
        }
    }
}

結果以下:

可是這個代碼執行 1000w的數據須要很久。 這個問題繼續研究。

源碼地址:https://github.com/doublnt/dotnetcore/tree/master/CSharpFundamental

歡迎大佬指點,還望不吝賜教。

相關文章
相關標籤/搜索