爲什麼position embedding就是相加一個隨機矩陣

時間 2021-01-15

原文原文鏈接

position embedding BERT 裏的實現：要思考一個問題，什麼是position embedding，就是：如果每個position的位置用0,1,2,3,4…來表示的話，怎樣像word embedding似的輸進模型裏呢，就是兩種辦法： one-hot 或者把position的0,1,2,3,4看成word id一樣用embedding_lookup表示成和word

>>阅读原文<<