NLP的編輯距離 一文讀懂

在NLP任務中經常會碰到比較兩個字符串的相似度,比如拼寫糾錯和指代判斷。用戶很可能在搜索時輸入錯別字,比如「微信」輸成了「爲信」,但是搜索引擎返回的結果糾正爲「微信」的搜索結果,如圖1-1。另外比如「北京大學校長」和「北大校長」,「北京故宮博物院」和「北京故宮」都是指的同一個人或事物。 上述問題,可以利用兩個詞或短語的編輯距離大小來解決。 圖1-1 搜索詞「爲信」的百度結果   編輯距離介紹 利用
相關文章
相關標籤/搜索