AI與Python - 強化學習

在本章中,您將詳細瞭解使用Python在AI中強化學習的概念。 強化學習的基礎知識 這種類型的學習用於基於評論者信息來加強或加強網絡。也就是說,在強化學習下訓練的網絡從環境中接收一些反饋。然而,反饋是有評價性的,而不是像監督學習那樣具有指導性。基於該反饋,網絡執行權重的調整以在將來獲得更好的批評信息。 這種學習過程類似於監督學習,但我們的信息可能非常少。下圖給出了強化學習的框圖 - 構建塊:環境和
相關文章
相關標籤/搜索