soft / hard attention 機制理解——機器學習中的soft 和 hard

時間 2020-12-23

標籤 NLP 深度學習人工智能 nlp 自然語言處理简体版

原文原文鏈接

Soft attention是一種全局的attention，其中權重被softly地放在源圖像所有區域 Hard attention一次關注圖像的一個區域，採用0-1編碼，時間花費較少，但是不可微分，所以需要更復雜的技術來進行訓練下圖是從果殼網（quora）摘取的一篇回答即在機器學習中soft 常常表示可微分，比如sigmoid和softmax機制而hard常常表示不可微分 soft

>>阅读原文<<