NVIDIA Tesla系列GPU適用於高性能計算(HPC)、深度學習等超大規模數據計算,Tesla系列GPU可以處理解析PB級的數據,速度比使用傳統CPU快幾個數量級,NVIDIA Tesla GPU系列P四、T四、P40以及V100是Tesla GPU系列的明星產品,雲服務器吧分享NVIDIA Tesla GPU系列P四、T四、P40以及V100參數性能對比:html
NVIDIA Tesla GPU系列P四、T四、P40以及V100
NVIDIA Tesla系列GPUP四、T四、P40以及V100性能規格參數對比表。
騰訊雲提供基於NVIDIA Tesla GPU的計算型GPU雲服務器,GPU實例規格包括GN6/GN6S/GN7/GN8/GN10X緩存
雲服務器吧 | Tesla T4:世界領先的推理加速器 | Tesla V100:通用數據中心 GPU | 適用於超高效、外擴型服務器的 Tesla P4 | 適用於推理吞吐量服務器的 Tesla P40 |
---|---|---|---|---|
單精度性能 (FP32) | 8.1 TFLOPS | 14 TFLOPS (PCIe) 15.7 teraflops (SXM2) |
5.5 TFLOPS | 12 TFLOPS |
半精度性能 (FP16) | 65 TFLOPS | 112 TFLOPS (PCIe) 125 TFLOPS (SXM2) |
— | — |
整數運算能力 (INT8) | 130 TOPS | — | 22 TOPS* | 47 TOPS* |
整數運算能力 (INT4) | 260 TOPS | — | — | — |
GPU 顯存 | 16GB | 32/16GB HBM2 | 8GB | 24GB |
顯存帶寬 | 320GB/秒 | 900GB/秒 | 192GB/秒 | 346GB/秒 |
系統接口/外形規格 | PCI Express 半高外形 | PCI Express 雙插槽全高外形 SXM2/NVLink | PCI Express 半高外形 | PCI Express 雙插槽全高外形 |
功率 | 70 W | 250 W (PCIe) 300 W (SXM2) |
50 W/75 W | 250 W |
硬件加速視頻引擎 | 1 個解碼引擎,2 個編碼引擎 | — | 1 個解碼引擎,2 個編碼引擎 | 1 個解碼引擎,2 個編碼引擎 |
關於NVIDIA TESLA系列GPU詳細介紹以下:服務器
NVIDIA TESLA V100
NVIDIA Tesla V100採用NVIDIA Volta架構,很是適合爲要求極爲苛刻的雙精度計算工做流程提供加速,而且仍是從P100升級的理想路徑。該GPU的渲染性能比Tesla P100提高了高達80%,藉此可縮短設計週期和上市時間。架構
Tesla V100的每一個GPU都可提供125 teraflops的推理性能,配有8塊Tesla V100的單個服務器可實現1 petaflop的計算性能。性能
NVIDIA TESLA P40
The Tesla P40可以提供高達2倍的專業圖形性能。Tesla P40可以對組織中每一個vGPU虛擬化加速圖形和計算(NVIDIA CUDA® 和 OpenCL)工做負載。支持多種行業標準的2U服務器。學習
Tesla P40可提供出色的推理性能、INT8精度和24GB板載內存。編碼
NVIDIA TESLA T4
NVIDIA Tesla T4的幀緩存高達P4的2倍,性能高達M60的2倍,對於利用NVIDIA Quadro vDWS軟件開啓高端3D設計和工程工做流程的用戶而言,不失爲一種理想的解決方案。憑藉單插槽、半高外形特性以及低至70瓦的功耗,Tesla T4堪稱爲每一個服務器節點實現最大GPU密度的絕佳之選。spa
NVIDIA TESLA P4
Tesla P4可加快任何外擴型服務器的運行速度,能效高達CPU的60倍。設計