改變世界的七大NLP技術,你瞭解多少?(上)

e51af19d6bfbd86ff9933426e90374fffc13e5f9

什麼是NLPgit

天然語言處理(NLP) 是計算機科學,人工智能和語言學的交叉領域。目標是讓計算機處理或「理解」天然語言,以執行語言翻譯和問題回答等任務。github

隨着語音接口和聊天機器人的興起,NLP正在成爲信息時代最重要的技術之一,同時它也是人工智能的關鍵部分。充分理解和表達語言的含義是一個很是困難的目標。爲何?由於人類的語言很特別。web

人類語言有什麼特別之處?算法

 

1.人類語言是專門爲傳達說話人的意圖而構建的系統。這不單單是一個環境信號,更是一個有意識的交流。
2.人類語言大可能是離散/符號的/分類的信號系統,大概是由於信號可靠性更高。
3.一種語言的分類符號能夠用幾種方式編碼爲通訊信號:聲音,手勢,寫做,圖像等。人類語言只是其中的一種。
4.人類語言是不明確的(與編程和其餘正式語言不一樣)。 所以,在表達、學習和使用語言/情境/情境/文字/視覺知識對人類語言方面存在高度複雜性。編程

 

NLP應用到哪裏?網絡

從NLP研究領域衍生出了一批快速增加的應用程序。如下是其中幾個:框架

1.拼寫檢查,關鍵字搜索,查找同義詞;機器學習

2.從網站提取信息,例如:產品價格,日期,地點,人員或公司名稱;性能

3.分類:長文檔的積極/消極情緒;學習

4.機器翻譯;

5.口語對話系統;

6.複雜的問答系統;

事實上,這些應用程序已經在現實中大量使用,從搜索到在線廣告匹配 ; 從自動/輔助翻譯到營銷或財務/交易的情緒分析 ; 從語音識別到chatbots /對話代理(自動化客戶支持,控制設備,訂購商品)。

268fe30ccc510f28d7d74cecdec2817e5f41c7bd

深度學習

大部分NLP技術都是由深度學習提供技術支持。近幾年,深度學習纔開始發揮做用,主要是由於:

·大量的訓練數據;

·更快的機器和多核CPU / GPU;

·性能高的新模型和算法:有效的端到端聯合系統學習、有效的使用上下文和任務間轉換的學習方法,以及正則化優化方法。

在深度學習中,表示學習試圖自動學習來自原始輸入的良好特徵或表示。而在機器學習中手動設計的特徵一般過多且不完整,須要花費很長時間進行設計和驗證。並且深度學習提供了一個很是靈活、通用且可學習的框架,用於呈現視覺和語言信息的世界。最初,它在語音識別和計算機視覺等領域取得突破。最近,深度學習方法在許多不一樣的NLP任務中表現出了很是高的性能。這些模型一般能夠經過單一的端到端模型進行訓練,而且不須要傳統的,特定於任務的特徵工程。

我最近完成了斯坦福大學關於天然語言處理與深度學習CS224n課程。該課程全面介紹了將深度學習應用於NLP的尖端研究。在模型方面,它涵蓋了詞向量表示、基於窗口的神經網絡、遞歸神經網絡、長期短時間記憶模型、遞歸神經網絡和卷積神經網絡,以及一些涉及存儲器組件的最新模型。

在此我想分享我學習的7種主要NLP技術以及使用它們的主要深度學習模型和應用程序。

福利:你能夠在此GitHub中得到相關課程!

相關文章
相關標籤/搜索