BERT解讀(論文 + TensorFlow源碼)

N個月前BERT就頻繁出如今筆者的視野中,只知道是Google出品的神奇好用的pretrain模型,但一聽到要用TPU去訓練,就有種「拜拜了您嘞」了感受。不過看到近期你們在談論的,在研究的,無一不是圍繞BERT等一系列的pretrain模型,不由感嘆大勢所趨!近期終於有時間靜下心來好好研讀這篇論文和它的源碼,並記錄以下,但畢竟BERT已經出了好久了,各路大神都把它研究得很透徹了,因此若有不周詳之處
相關文章
相關標籤/搜索