1.什麼是監督性學習?Supervised Machine Learning.算法
在監督性學習,咱們給定一個數據集以及咱們已經知道正確輸出的結果,而後找到一個輸入和輸出的關係。機器學習
In Supervised learning,we are given a data set and already know what our correct output should look like ,having the idea that there is a relationship between the input and output.ide
監督性學習的問題被分爲兩大類,第一類是迴歸問題,第二類是分類問題。在迴歸問題,咱們試着預測結果在連續輸出,意味着咱們試圖將輸入變量映射到某個連續函數。在分類問題中,相反,咱們試圖預測離散輸出的結果。換句話說,咱們試圖將輸入變量映射到離散類別中。函數
監督性學習目的是在構建可以根據存在不肯定性的證據作出預測的模型。監督性學習算法接受已知的輸入數據集和對數據的已知響應輸出,而後訓練模型,讓模型可以未新輸入數據的響應生成合理的預測。學習
監督性學習採用分類(classification)和(regression)技術開發預測模型。idea
1.分類技術可預測離散的響應(輸出)--例如:對象
電子郵件是真正的郵件仍是垃圾郵件,腫瘤是惡性仍是良性。分類模型可將輸入數據劃分不一樣類別。典型應用包括:醫學成像,語音識別,信用評估。blog
2,迴歸技術可預測連續的響應--例如,電力需求中溫度或波動的變化。ip
典型的應用包括:電力系統負荷預測和算法交易。開發
應用:
使用監督性學習預測心臟病發做
假設臨牀醫生但願預測某位患者在一年內是否會心臟病發做,他們有一千就醫患者的患者相關數據,包括年齡,體重,身高以及血壓。他們呢hi到一千的患者在一年內是否出現過心臟病發做,所以,問題在於如何將現有數據合併到模型中,並讓該模型可以預測新患者在一年內是否出現心臟病發做。
2. 什麼是非監督性學習?UnSupervised Machine Learning.
非監督性學習可發現數據中隱藏的模式或內在結構,這種技術可包含未標記響應的輸入數據的數據集執行推理。
聚類是一種最經常使用的無監督性學習技術,這種技術可經過探索性數據分析發現數據中隱藏的模式或分組。
聚類的應用包括基因序列分析,市場調查和對象識別。
總結:
監督性機器學習就是根據已知的輸入和輸出訓練模型,讓模型可以預測將來輸出。
非監督性機器學習就是從輸入數據中找出隱藏模式或內在結構。
那麼如何肯定使用哪一種算法?
選擇正確的算法看似難以駕馭,須要從幾十種監督性學習和非監督性學習算法中選擇,每種算法又包含不一樣的學習方法。
沒有最佳方法和徹底之策。找到正確的算法知識是錯過程的一部分,即便經驗豐富的數據科學家,也沒法說出某種算法是否無需試錯便可使用,可是算法的選擇還卻決咱們要處理數據的大小以及類型,要從數據中獲取洞察力以及如何使用這些洞察力。這纔是機器學習的開始。。
PS:
知識引用
吳恩達的機器學習
matlab的機器學習