天然語言處理的基本流程:翻譯
1)分詞排序
2)命名實體識別,主要有人名,地名,機構名等語法
3)詞性標註,對分詞後的詞語進行語義標註命名
4)句法分析,主要是要構建語法樹,標註單詞,短語,句子的語法問答
5)語義分析,包括兩部分:語義消歧,主要是針對多義詞在文中的意思;語義角色標註,主要是要標出一個句子中主謂賓狀語等。語義角色標註過於依賴句法分析的準確性,不過目前自動句法分析的準確性並非特別高,所以語義角色標註的效果也通常。語言
6)篇章分析,在一篇文章中段落的順序、句子的順序都是很重要的,按照正確的表達序列排序才能構成完整的篇章。在篇章分析中能夠劃分的結構有篇章-段落-句子-詞、篇章-句子-詞、篇章-詞等。自然語言處理
上面的六步只不過是天然語言處理中的中間步驟,並非天然語言處理的最終目標系統
應用一:機器翻譯文章
應用二:語音翻譯
應用三:文本分類與情感分類
應用四:信息檢索與問答系統
應用五:自動文摘與信息抽取
應用六:口語信息處理與人機對話系統