[ML]機器學習分類科普

學習的兩個分支:基於符號主義的專家系統(使用規則),基於鏈接主義的機率統計的系統(如機器學習,深度學習)算法

使用哪一種系統主要看數據量,沒有數據或者數據量不多的時候使用專家系統,有大量數據的時候使用機器學習或者深度學習網絡

專家系統=推理引擎+知識機器學習

專家系統的流程:學習

任務:搭建金融知識圖譜spa

一、金融領域或者風控領域的專家,輸出經驗深度學習

二、知識圖譜工程師結合專家的經驗構建知識圖譜,並將知識導入到知識庫中工作流

三、AI/算法工程師構建推理引擎(基於知識庫),生成APIit

四、業務系統使用API,便可使用金融知識圖譜table

專家系統的特色:class

  • 處理不肯定性

  • 知識的表示,如知識圖譜,將非結構的知識表示成結構化的知識圖譜

  • 可解釋性,由於它是基於規則來作的,規則是很好解釋的,因此專家系統具備很是好的可解釋性

  • 能夠作知識推理,由於它的可解釋性較強,所以能夠作推理

專家系統的缺點:

  • 涉及大量的規則

  • 須要領域專家來主導

  • 可移植性差

  • 學習能力差

  • 人能考慮的範圍是有限的

搭建專家系統時可能會遇到的問題:

  • 邏輯推理

  • 解決規則衝突,引用邏輯推理的方法:有n條已知的規則,有1條規則是須要證實的,若是能證實出來,說明規則沒有衝突,不然,規則是衝突的,咱們須要刪除衝突的規則

  • 選擇最小規則的子集,有不少的方法,如貪心方法等

解決一個難題的思路

  • 找出一個相似的「經典的」問題,如選擇最小規則的子集方法,對應的經典問題能夠是「set cover problem」

  • 閱讀相關文獻

 

機器學習

一、定義:自動從已有的數據裏找出一些規律,而後把學到的這些規律應用到對將來數據的預測中,或者在不肯定環境下自動的作一些決策。

二、分類:

  監督學習 無監督學習
生成模型 樸素貝葉斯方法 HMM,LDA,GMM(高斯混合模型)
判別模型 邏輯迴歸方法,CRF模型

監督學習:線性迴歸,邏輯迴歸,樸素貝葉斯,神經網絡,SVM,隨機森林,Adaboost,CNN等

無監督學習:K-means(聚類),PCA,ICA,MF(矩陣分解),LSA,LDA

生成模型:經過已訓練好的模型,生成數據

判別模型:計算數據之間的區別

搭建一個模型的工做流程:

一、經典流程:數據——>數據清洗——>特徵工程——>建模——>預測

二、端到端流程:去掉特徵工程

——來源於貪心科技NLP班的筆記

相關文章
相關標籤/搜索