Deep Learning for Nature Language Processing --- 第四講（下）

時間 2021-07-11

原文原文鏈接

A note on matrix implementations 將J對softmax的權重W和每個word vector進行求導：儘量使用矩陣運算（向量化），不要使用for loop。模型訓練中有兩個開銷比較大的運算：矩陣乘法f=Wx和指數函數exp Softmax(=logistic regression) is not very powerful softmax只是在原來的向量空間中給出

>>阅读原文<<