測試minpy 調用gpu 加速矩陣相乘. accelerate matrix multiplication

測試minpy 調用gpu加速矩陣相乘,已經寫了幾篇文章.前幾篇文章得到的結果不太好,主要原因是跟想象中的結果並不是很相同. 主要有兩點,一個是前幾篇測試加速的效果並不是很好,矩陣要很大的時候才能看到明顯的加速.另一個是我一個先驗的經驗認爲float32的加速效果要明顯比float64的加速效果要好很多. 但是這兩點在前面的測試中並沒有得到. 這個就能感受到理論跟實驗之間差距.如果你相信理論,相信
相關文章
相關標籤/搜索