python天然語言處理——1.5 自動理解天然語言

微信公衆號:數據運營人
本系列爲博主的讀書學習筆記,如需轉載請註明出處。html

第一章 語言處理與python

1.5 自動理解天然語言詞意消歧指代消解自動生成語言機器翻譯人機對話系統文本的含義python

1.5 自動理解天然語言

詞意消歧

你們都應該知道,不管是漢語,英語甚至其餘語言,每個詞語都有不一樣的含義,所謂的詞意消歧就是經過文章的上下文來肯定該詞語在該文中所表達的含義。微信

指代消解

指代消解做爲信息抽取領域的一個熱點技術,從廣義上看就是在文章中肯定代詞紙箱那個名詞短語的問題。按照指向通常分爲回指和預指,回指就是代詞的先行詞在代詞的前面;預指指代詞的先行詞子啊代詞的後面。通常包含人稱代詞,指示代詞普通名詞短語等。app

自動生成語言

隨着近年來文本數據的指數級增加和AI技術的不斷髮展,一些大型的公司經過收集的文本進行建模學習,實現了自動生成語言的技術,如騰訊的新聞寫做機器人,自動生成股評等。
框架

騰訊寫做機器人
騰訊寫做機器人
機器翻譯

長久以來,機器翻譯( MT)都是語言理解的聖盃,人們但願能找到從根本上提供高品質的符合語言習慣的任意兩種語言之間的翻譯。雖然目前的機器翻譯技術獲得了很大的提高,但由於每個詞語都有不少的含義,以及機器對上下文的銜接存在瑕疵,還有待去提升。
學習

谷歌翻譯
谷歌翻譯
人機對話系統

咱們所能看到的最基礎一些人機系統有淘寶京東客服等,經過一些關鍵詞與進行溝通對話。而語音的人機對話系統會稍微複雜,其中最爲核心的技術是語音識別成文字(ASR)/語言理解(NPU)/文字合成爲語音(TTS)
spa

人機對話系統框架
人機對話系統框架
文本的含義

近年來,一個叫作文本含義識別(Recognizing Textual Entailment,簡稱RTE)的「公開共享任務」成爲語言理解所關注的焦點,和咱們日常的語言理解不一樣,相似於公務員考試中的推理題。
如:
(1)若是有人是一本書的做者,那麼他寫了這本書;
(2)若是有人是一本書的編輯,那麼他沒有寫這本書;
(3)若是有人是18本書的編輯或做者,責沒法判定他是18本書的做者。翻譯

相關文章
相關標籤/搜索