如何設計一顆40PFLOPS量級的AI芯片?

作者 | 唐杉 來源 | 公衆號StarryHeavensAbove Nvidia剛剛發佈的最強「GPU」DGX-2,由16顆V100+12顆NVSwitch芯片組成,能夠提供2PFLOPS。而單顆V100的Deep Learning處理能力是120TFLOPS。如果我們要設計一顆能夠實現40PFLOPS處理能力的AI芯片,該怎麼操作?其實挺「簡單」,把芯片面積儘可能做大。那麼單個裸片(Die),
相關文章
相關標籤/搜索