如何在PAI平臺跑實驗

PAI平臺使用教程


  • build image
  • upload & run
  • storage system

build image

首先去官網下載docker windows,若是系統不適配,就用官網的docker tools輔助安裝。安裝後,右下角任務欄找到小鯨魚圖案,右鍵點擊setting。在左邊的欄目裏面找到Daemon選項,進去後就會看到咱們什麼都沒有配置,因此按照下面的信息配置docker:python

"registry-mirrors":["http://f1361db2.m.daocloud.io"]
"insecure-registries":["192.168.193.253:5000"]

配置好後打開cmd或其餘命令行軟件,用下面的指令下載基礎鏡像到本地並運行:linux

docker pull 192.168.193.253:5000/pytorch:v0.4.0
#此鏡像爲pytorch0.4版本的基礎鏡像
docker image ls
#查看目前本地所擁有的鏡像
docker container run -ti <Image ID>
#從查看過程當中能夠獲得Image ID,輸到對應位置,運行鏡像

運行鏡像後就進入linux的terminal了,你擁有root權限,能夠進行任何操做。在其中配置好你想要的環境
弄完以後輸入exit退出
咱們運行下面幾條指令,把剛剛弄好的鏡像上傳到服務器:git

docker container ls -l
#查看剛剛編輯的鏡像,主要記住其container ID
docker container commit <container ID>
#把鏡像commit一下,返回一個sha256編碼就表示成功了
docker image ls
#查看一下剛剛commit的鏡像id 剛剛commit的名字爲none,記住其image id
docker image tag <ImageID> <name>:<tag>
#用這個命令給鏡像起名字,注意name 和 tag 要起成如下格式:192.168.193.253:5000/zhangyu:0.3 IP必須有,zhangyu那部分填本身的,冒號後面爲tag,你能夠看成版本號。
docker push <Image 名字>
#上傳你的鏡像

至此鏡像就配置完了,下面就能夠上傳代碼,跑代碼了github

upload & run

首先在本地python環境安裝常瑞師兄編寫的pai包,常瑞師兄在github上寫的比較詳細,具體操做按照上面來,我在這裏主要介紹一下configuration中的注意事項,所涉及的都是須要改的,其他能夠不予理睬。
jobname:是咱們提交任務的名稱,同時平臺會在root下創建一個此名稱的文件夾,運行其中代碼。初次咱們起名爲**_,上傳時平臺會在_後隨即給你添數字,若是你不按照此格式,他會把你起的名稱覆蓋。
image:填你要使用的鏡像名稱
gputype:填你要使用的gpu 目前有兩種 geforce1080ti geforce2080ti
cpunumber:填你要申請的cpu數量,通常3就足夠了
memoryMB:通常四、5g就可
shmMB:影響讀數據速度,能夠填1024或2048,填多了沒用
gpuNumber:這裏填你要申請的gpu數量,通常都爲1個,若是須要並行跑,能夠申請多個
command:/bin/bash /root/mount.sh 這個必輸,其他的就填你要運行的指令。docker

storage system

平臺採用掛載的形式,把服務器的部分存儲空間掛載到了平臺上,掛載事後的位置爲:/root/data/
裏面存放/root/data/datasets/數據集,/root/data/models/模型庫,/root/data/ouputs/存一些代碼的輸出
咱們能夠用WinSCP或XTerm連文件系統:
ip爲192.168.193.253 用戶名爲fileserver 密碼 123456windows

相關文章
相關標籤/搜索