動手學深度學習第十二課:循環神經網絡

展開: 左邊的前饋神經網絡。 右邊的時循環神經網絡,我們可以發現: 第一個輸入的你,會不斷的向後傳遞。不僅僅只是用在了第一次。 送入神經網絡的一般是一個批量,應該指的是不同語料同一位置的詞向量吧。 記憶體h的維度是自己給定的,(在mooc中講的是記憶體的個數) n表示批量的大小,h表示記憶體的個數(隱藏層的大小), 如果神經網絡的目標是輸出以一個詞的所有可能性,那麼y就應該是詞典的大小。 梯度裁剪
相關文章
相關標籤/搜索