從Google人工智能DeepMind團隊的AlphaGo的論文算法提取的學習方法:大腦邏輯結構圖

貝葉斯定理考慮的是 P(A|B)是在B發生的情況下A發生的可能性。在現實中,事件A受多個事件的影響,還可能受上一次事件A本身的影響(反饋)。 可以寫成 人工智能通用反饋公式y=f(x,y1),其中y1=f(x)。它是強化學習和自我學習的基礎。 從AlphaGo的論文算法 提取的人工智能學習方法 第一層 價值判斷          重要的----百裏挑一 ,去掉99%無用的。 第二層 快速響應(簡單
相關文章
相關標籤/搜索