《天然語言處理入門》讀書筆記

第一章,新手上路 1.1天然語言與編程語言 詞彙量 結構化: 歧義性: 容錯性; 易變性 簡略性 1.2天然語言處理的層次 文本:語音(語音識別),圖像(光學符號識別),和文本。 詞法分析: 中文分詞(將文本分割爲有意義的詞語,將字序列分割爲次序列), 詞性標註(肯定每一個詞語的類別和淺層的歧義消除), 命名實體識別(較長的專有名詞) 信息抽取:根據單詞和詞性,抽取一部分有用的信息 文本分類與文本
相關文章
相關標籤/搜索