歡迎你們關注個人知乎專欄,那裏會分享個人項目總結以及所看的好博客
前段時間作了命名實體識別這個項目,在這裏總結一下資源html
命名實體識別的資料網上很少,尤爲是讓咱們能夠跟着作的。想要作這個方向,能夠先找簡單的入手。語料能夠用人民日報標註語料,目前流行的方法有兩種,一種基於CRF,一種基於深度學習。我我的強烈建議先作項目,再去深刻理解原理,這二者相輔相成,才能成大事機器學習
本文脈絡簡單,就是從項目和原理兩方面推薦給你們相關的博客
首先給你們一個開胃菜,先入門一下命名實體識別,總不能作了半天不知道本身在幹什麼吧
命名實體識別(NER)的二三事工具
- 用CRF作命名實體識別(一)主要介紹的是關於人民日報標註語料的預處理,利用CRF++工具包對模型進行訓練以及測試。
- 用CRF作命名實體識別(二)主要是升級對上一篇升級,新添加了一些特徵,着重介紹瞭如何生成組織名特徵詞這個特徵。你們也許看的只知其一;不知其二,進去讀讀便豁然開朗了
- 用CRF作命名實體識別(三)主要是總結了全部特徵的生成思路,並對它們作了一個效果對比
用深度學習作命名實體識別(附代碼) 主要簡單的介紹下BILSTM-CRF的原理,以及如何把大佬的數據集換成咱們本身的數據集,進行訓練。學習
原理的理解很不容易,這裏主要推薦閱讀書籍和博客。主讀書籍,用博客來輔助理解測試
書籍推薦:吳軍的《數學之美》,周志華的西瓜書《機器學習》,李航的《統計學習方法》.net
博客推薦:htm
如何用簡單易懂的例子解釋條件隨機場(CRF)模型?它和HMM有什麼區別?blog
一文搞懂HMM(隱馬爾可夫模型) - skyme - 博客園get
機器學習 --- 4. 大內密探HMM(隱馬爾可夫)圍捕賭場老千
推薦給初學LSTM或者懂個大概卻不徹底懂的人 - CSDN博客
中文的命名實體識別就到這裏了,你們有疑問歡迎提出來一塊兒探討。另外要轉載的話請聯繫我,謝謝各位了
歡迎掃碼關注