英特爾分佈式深度學習平臺Nauta-安裝、配置與管理指南

英特爾分佈式深度學習平臺Nauta-安裝、配置與管理指南

隨着人工智能的發展,深度學習的價值不斷增加,但實現它多是一個複雜耗時的過程。英特爾(Intel)正尋求經過其在 Kubernetes 進行分佈式深度學習的新開源平臺來改變這一情況,該深度學習平臺稱爲:Nautanode

 

本指南包括 Nauta 安裝、配置和管理,提供安裝和配置Nauta的具體步驟。 同時包含了Nauta 要求、配置的選項,以及管理任務。git

注意: 配置 Nauta 客戶端的指南,參考 Nauta User Guidegithub

Nauta 是一個軟件套件,提供了多用戶、分佈式計算環境用於運行深度學習的模型訓練試驗。 實驗結果能夠查看和監視,能夠經過命令行界面 (CLI)、Web UI 或 TensorBoard*來查看。你能夠使用已有的數據集,本身的數據或者在線下載數據,建立共有或私有目錄來在團隊間協做。服務器

Nauta 運行於 Kubernetes* 和 Docker*,易於管理,具備較好的伸縮性。Nauta 使用定製模版來消除建立和運行單個/多個節點深度學習的複雜性,在標準的容器環境中運行,不須要複雜的系統和腳本。分佈式

硬件需求

Nauta is intended to run on a multi-server Kubernetes cluster. To run Nauta, you will need at least one Master node, and one or more Worker nodes. Nauta is a platform for performing Deep Learning training, and requires robust hardware specifications to run with optimal performance.ide

安裝概覽

安裝Nauta 在 'bare metal' (for example, non-cloud) 服務器環境,須要:學習

  • 執行下面的命令:    
    • git clone --recursive https://github.com/IntelAI/nauta.git
    • cd nauta
  • 編譯基本package (makefile實現自動化的系列處理,有一些須要的最小的 packages集合)。
  • 發佈 Nauta's inventory 文件告訴master 和 worker nodes在哪裏,以及如何訪問。
  • 配置Nauta's 配置文件,告訴關於 proxies, network quirks 和 filesystem 偏好等。
  • 運行安裝腳本。

該過程包括:ui

  • 建立 Kubernetes cluster, 全部的須要的 Docker files用於運行 Tensorflow*, Jupyter*, Tensorboard, 和 Horovod*。人工智能

  • 安裝 Nauta server-side 應用到新的Kubernetes cluster,而後啓動系統來運行。spa

完成上面的操做須要花一些時間,咱們一步步來。

文檔 Flow

該指南包含下面的主題:

更多:

相關文章
相關標籤/搜索