這段機器學習基礎視頻將幫助您瞭解什麼是機器學習,機器學習有哪些類型-有監督,無監督和強化學習,如何經過簡單的示例學習機器學習以及如何在各個行業中使用機器學習。
markdown
咱們知道人類從過去的經驗中學習,機器遵循人類的指示 網絡
若是人類可以訓練機器從過去的數據中學習呢?嗯,這被稱爲機器學習,但它不只僅是學習,它還涉及理解和推理,因此今天咱們將學習機器學習的基礎知識。 插一段《Python3入門機器學習經典算法與應用》這門課程中的解釋:人類是怎麼學習的?經過給大腦輸入必定的資料,通過學習總結獲得知識和經驗,有當相似的任務時能夠根據已有的經驗作出決定或行動。 機器學習
機器學習(Machine Learning)的過程與人類學習的過程是很類似的。機器學習算法本質上就是得到一個 f(x) 函數表示的模型,若是輸入一個樣本 x 給 f(x) 獲得的結果是一個類別,解決的就是一個分類問題,若是獲得的是一個具體的數值那麼解決的就是迴歸問題。 機器學習與人類學習的總體機制是一致的,有一點區別是人類的大腦只須要很是少的一些資料就能夠概括總結出適用性很是強的知識或者經驗,例如咱們只要見過幾只貓或幾隻狗就能正確的分辨出貓和狗,但對於機器來講咱們須要大量的學習資料,但機器能作到的是智能化不須要人類參與。保羅聽新歌,他根據歌曲的節奏、強度和聲音的性別來決定喜歡仍是不喜歡。 函數
爲了簡單起見,咱們只使用速度和強度。因此在這裏,速度是在 x 軸上,從緩慢到快速,而強度是在 y 軸上,從輕到重。咱們看到保羅喜歡快節奏和高亢的歌曲,而他不喜歡慢節奏和輕柔的歌曲。 如今咱們知道了保羅的選擇,讓咱們看看保羅聽一首新歌,讓咱們給它命名這首歌 A,歌曲 A 速度快,強度飆升,因此它就在這裏的某個地方。看看數據,你能猜出球在哪裏會喜歡這首歌?對,保羅喜歡這首歌。oop
經過回顧保羅過去的選擇,咱們可以很容易地對未知的歌曲進行分類。假設如今保羅聽了一首新歌,讓咱們把它貼上 B 的標籤,B 這首歌就在這裏的某個地方,節奏中等,強度中等,既不放鬆也不快速, 既不輕緩也不飛揚。post
如今你能猜出保羅喜歡仍是不喜歡它嗎?不能猜出保羅會喜歡或不喜歡它,其餘選擇還不清楚。沒錯,咱們能夠很容易地對歌曲 A 進行分類,可是當選擇變得複雜時,就像歌曲B 同樣。機器學習能夠幫你解決這個問題。性能
讓咱們看看如何。在歌曲 B 的同一個例子中,若是咱們在歌曲 B 周圍畫一個圓圈,咱們會看到有四個綠色圓點表示喜歡,而一個紅色圓點不喜歡。學習
若是咱們選擇佔大多數比例的綠色圓點,咱們能夠說保羅確定會喜歡這首歌,這就是一個基本的機器學習算法,它被稱爲 K 近鄰算法, 這只是衆多機器學習算法之一中的一個小例子。人工智能
可是當選擇變得複雜時會發生什麼?就像歌曲 B 的例子同樣,當機器學習進入時,它會學習數據,創建預測模型,當新的數據點進來時,它能夠很容易地預測它。數據越多,模型越好,精度越高。
機器學習的方式有不少,它能夠是監督學習、無監督學習或強化學習。
讓咱們首先快速瞭解監督學習。假設你的朋友給你 100 萬個三種不一樣貨幣的硬幣,好比說一個是 1 歐元,一個是 1 歐爾,每一個硬幣有不一樣的重量,例如,一枚 1 盧比的硬幣重 3 克, 一歐元重 7 克,一歐爾重 4 克,你的模型將預測硬幣的貨幣。在這裏,體重成爲硬幣的特徵,而貨幣成爲標籤,當你將這些數據輸入機器學習模型時,它會學習哪一個特徵與哪一個結果相關聯。
例如,它將瞭解到,若是一枚硬幣是三克,它將是一枚盧比硬幣。根據新硬幣的重量,你的模型將預測貨幣。所以,監督學習使用標籤數據來訓練模型。在這裏,機器知道對象的特徵以及與這些特徵相關的標籤。
在這一點上,讓咱們看看與無監督學習的區別。假設你有不一樣球員的板球數據集。當您將此數據集送給機器時,機器會識別玩家性能的模式,所以它會在 x 軸上使用各自的 Achatz 對這些數據進行處理,同時在 y 軸上運行
在查看數據時,你會清楚地看到有兩個集羣,一個集羣是得分高,分較少的球員,而另外一個集羣是得分較少但得分較多的球員,因此在這裏咱們將這兩個集羣解釋爲擊球手和投球手。
須要注意的重要一點是,這裏沒有擊球手、投球手的標籤,所以 使用無標籤數據的學習是無監督學習。所以,咱們瞭解了數據被標記的監督學習和數據未標記的無監督學習。
而後是強化學習,這是一種基於獎勵的學習,或者咱們能夠說它的工做原理是反饋。
在這裏,假設你向系統提供了一隻狗的圖像,並要求它識別它。系統將它識別爲一隻貓,因此你給機器一個負面反饋,說它是狗的形象,機器會從反饋中學習。最後,若是它遇到任何其餘狗的圖像,它將可以正確分類,那就是強化學習。
讓咱們看一個流程圖,輸入給機器學習模型,而後根據應用的算法給出輸出。若是是正確的,咱們將輸出做爲最終結果,不然咱們會向火車模型提供反饋,並要求它預測,直到它學
你有時不知道在當今時代,機器學習是如何成爲可能的,那是由於今天咱們有大量可用的數據,每一個人都在線,要麼進行交易,要麼上網,每分鐘都會產生大量數據,數據是分析的關鍵。
此外,計算機的內存處理能力也在很大程度上增長,這有助於他們絕不拖延地處理手頭如此大量的數據。
是的,計算機如今擁有強大的計算能力,因此有不少機器學習的應用。
僅舉幾例,機器學習用於醫療保健,在醫療保健中,醫生能夠預測診斷,情緒分析。
科技巨頭在社交媒體上所作的推薦是另外一個有趣的應用。金融部門的機器學習欺詐檢測,並預測電子商務部門的客戶流失。
我但願你已經理解了監督和無監督學習,因此讓咱們作一個快速測驗,肯定給定的場景是使用監督仍是非監督學習。
場景 1: Facebook 在一張標籤照片相冊中的照片中識別你的朋友解釋: 這是監督學習。在這裏,Facebook 正在使用標記的照片來識別這我的。所以,標記的照片成爲圖片的標籤,咱們知道當機器從標記的數據中學習時,它是監督學習。
場景 2: 根據某人過去的音樂選擇推薦新歌解釋: 這是監督學習。該模型是在預先存在的標籤 (歌曲流派) 上訓練分類器。這是 Netflix,Pandora 和 Spotify 一直在作的事情,他們收集您已經喜歡的歌曲/電影,根據您的喜愛評估功能,而後根據相似功能推薦新電影/歌曲。
場景 3: 分析可疑交易的銀行數據並標記欺詐交易解釋: 這是無監督學習。在這種狀況下,可疑交易沒有定義,所以沒有 「欺詐」 和 「非欺詐」 的標籤。該模型試圖經過查看異常交易來識別異常值,並將其標記爲 「欺詐」。