TVM: End-to-End Optimization Stack for Deep Learning

why TVM 要讓AI芯片支持深度學習架構(如TensorFlow, MXNet, Caffe, and PyTorch,芯片都有自己的指令集(例如彙編,C語言),要將深度學習架構等部署到芯片上就需要將深度學習架構中的這些代碼編譯成芯片支持的指令集,所以要從頭到尾設計一套軟件棧,做一套全棧的優化。 所以現在的許多深度學習的架構只能在某一些廠商的GPU設備上獲得加速,這種支持依賴於特定的GPU庫,
相關文章
相關標籤/搜索