機器學習的任務是從屬性X預測標記Y,即求機率P(Y|X);機器學習
training data給了正確的答案即label,任務就是創建相應的模型,訓練樣本集外的數據進行分類預測。學習
生成模型學習一個聯合機率分佈P(x,y)
常見的判別方法有 k近鄰法、感知機、決策樹、邏輯迴歸、線性迴歸、最大熵模型、支持向量機(SVM)、提高方法、條件隨機場(CRF)io
判別模型學習一個條件機率分佈P(y|x)
常見的生成方法有混合高斯模型、樸素貝葉斯法和隱形馬爾科夫模型方法
判別式模型舉例:要肯定一個羊是山羊仍是綿羊,用判別模型的方法是從歷史數據中學習到模型,而後經過提取這隻羊的特徵來預測出這隻羊是山羊的機率,是綿羊的機率。
生成式模型舉例:利用生成模型是根據山羊的特徵首先學習出一個山羊的模型,而後根據綿羊的特徵學習出一個綿羊的模型,而後從這隻羊中提取特徵,放到山羊模型中看機率是多少,在放到綿羊模型中看機率是多少,哪一個大就是哪一個。數據
判別式模型是根據一隻羊的特徵能夠直接給出這隻羊的機率(好比logistic regression,這機率大於0.5時則爲正例,不然爲反例),而生成式模型是要都試一試,最大的機率的那個就是最後結果~block
對未標記的樣本進行訓練學習,比發現這些樣本中的結構知識。 (KMeans,DL)生成