TPU結構總結

TPU只完成推理過程,訓練過程在GPU上完成。TPU可以像GPU一樣通過PCIe總線接口掛載到現有的服務器上。設計目標是爲了在TPU上完成所有的推理模型,從而減少和主機CPU的交互,進而滿足2015年及今後的神經網絡需求。下圖是TPU的整體結構框圖。 主機通過PCIe Gen3x16的總線發送TPU的指令到其中的指令buffer內,內部模塊之間通過典型的256位寬通路連接。右上角的矩陣乘法單元是T
相關文章
相關標籤/搜索