第七章-從文本中提取信息

時間 2020-12-30

原文原文鏈接

對於任何給定的問題，都可能有人在某處寫下了答案。以電子形式提供的自然語言文本數量確實驚人，而且每天都在增加。然而，自然語言的複雜性使得獲取文本中的信息非常困難。NLP的技術水平離從無限制的文本構建通用意義表示還有很長的路要走。如果我們把精力集中在有限的一系列問題或「實體關係」上，比如「不同的設施在哪裏」或「哪家公司僱用了誰」，我們就能取得重大進展。本章的目標是回答以下問題: 1.如何構建一個從非結