接觸NLP也有好長一段時間了,可是對NLP限於知道,可是對總體沒有一個很好的認識。特整理了一下思緒,總結記錄下:網絡
1、NLP的定義機器學習
仍是按照常規的邏輯來看下定義:NLP(Natural Languange Processing,天然語言處理),方法是應用計算機來處理,理解和應用人類語言,目的是達到人機之間進行交流。學習
分紅天然語言理解和天然語言生成兩部分。引用一個表來歸納下:網站
2、NLP的應用翻譯
- 機器翻譯:將一種語言翻譯成另一種語言,例如:百度翻譯
- 情感分析:挖掘人們的觀點,情緒對產品、服務等的態度,來評價服務等。起源博客等社交網絡。
- 智能問答:機器人回答輸入的問題,一些網站的智能問答。
- 文摘生成:機器準確概括,總結併產生文本摘要。
- 文本分類:採集各類文章,進行主題分析,從而進行自動分類。例如垃圾郵件等。
- 輿論分析:經過輿論的內容,半段輿論的導向。分析傳播路徑以及發展規律,對很差的輿論進行有效控制。
- 知識圖譜:把知識點經過相互之間的連理鏈接起來的網絡圖。
3、NLP知識構成blog
天然語言處理做爲一門比較熱的行業,須要語言學、統計學、機器學習、深度學習及天然語言相關理論知識。深度學習
- 句法語義分析:針對目標句子進行分詞,詞性標註,命名實體識別,句法分析,語義角色識別和多一次消歧等。
- 關鍵詞提取:提取目標文本中的主要信息。主要明確,誰,什麼時間,什麼緣由,幹了什麼事,有啥結果。主要涉及實體識別,時間抽取,因果關係等。
- 文本挖掘:對文本的聚類,分類,信息抽取,摘要,情感分析及對挖掘信息和知識的可視化化。
- 機器翻譯:包含文本翻譯,語音翻譯,手寫翻譯,圖形翻譯等。
- 信息檢索:信息進行分類歸檔。
- 問答系統:對語言表達問題。
- 對話系統:經過回合對話,跟用戶進行聊天,回答,完成任務。