動手深度學習(1)

(1)假如你正在實現一個全連接層,全連接層的輸入形狀是7×8,輸出形狀是7×1,其中7是批量大小,則權重參數ww和偏置參數bb的形狀分別是8x1和1x1.。 (2) 課程中的損失函數定義爲: def squared_loss(y_hat, y): return (y_hat - y.view(y_hat.size())) ** 2 / 2 將返回結果替換爲下面的哪一個會導致會導致模型無法訓練:(B
相關文章
相關標籤/搜索