VMware ESXi 6.5 安裝NVIDIA K2 GPU 顯卡硬件驅動和配置圖文

安裝請參考 https://blogs.vmware.com/apps/2018/09/using-gpus-with-virtual-machines-on-vsphere-part-3-installing-the-nvidia-grid-technology.html

GPU兼容性列表查詢:https://www.nvidia.com/en-us/data-center/tesla/tesla-qualified-servers-catalog/

 html

在vSphere上使GPU和虛擬機安裝NVIDIA GRID技術

主機開啓系統維護

esxcli system maintenanceMode set --enable true服務器

(能夠自行在網頁操做)app

image.png


將GPU設備設置爲vGPU模式

esxcli graphics host set --default-type SharedPassthruide

image.png

返回Default Graphics Type: SharedPassthru

esxcli graphics host get

image.png spa

安裝VIB

安裝顯卡驅動
esxcli software vib install -v /NVIDIA/NVIDIA-VMware_ESXi_6.5_Host_Driver_390.42-1OEM.670.0.0.7535516.vib3d

此處的文檔路徑是在根目錄下。

image.png
更新顯卡驅動
esxcli software vib update -v /tmp/NVIDIA-VMware_ESXi_6.5_Host_Driver_367.128-1OEM.650.0.0.4598673.vib

 orm

ESXi主機服務器退出維護模式

esxcli system maintenanceMode set --enable falseserver

安裝在ESXi主機上的VIB,並確保正確完成了NVIDIA VIB

esxcli software vib list | grep -i NVIDIA


 htm

驅動檢查

gpuvm  vGPU

image.png blog

驅動檢查2

lspci -n | grep 10de

image.png


其中10de表明此設備來自NVIDIA公司

0300: Graphics — 表明爲圖形模式

0302: Compute — 則代表爲計算模式,須要經過gpumodeswitch修改成圖形模式

GPU卡和ESXi是否能夠正常工做

nvidia-smi

image.png 

檢查是否有vgpu資源

nvidia-smi vgpu –s

image.png

 

部分報錯failed to initialize NVML:Unknown Error

問題分析

  1. DELL服務器BIOS設置I/O參數
  2. ECC設置
  3. 英偉達顯卡驅動版本不對

 

解決辦法

  1. 設置BIOS內存映射I/O庫設置爲512GB(默認狀況下爲56TB)
  2. 關閉ECC
  3. 更換顯卡驅動版本
相關文章
相關標籤/搜索