機器學習筆記,https://feisky.xyz/machine-learning/html
https://kairen.github.io/2018/03/21/kubernetes/k8s-federation/git
Kubeflow 是 Google 發佈的用於在 Kubernetes 集羣中部署和管理 tensorflow 任務的框架。主要功能包括github
部署以前須要確保app
對於開啓 RBAC 的 Kubernetes 集羣,首先要建立管理員角色綁定:框架
kubectl create clusterrolebinding tf-admin --clusterrole=cluster-admin --serviceaccount=default:tf-job-operator
而後運行如下命令部署機器學習
ks init my-kubeflow cd my-kubeflow ks registry add kubeflow github.com/google/kubeflow/tree/master/kubeflow ks pkg install kubeflow/core ks pkg install kubeflow/tf-serving ks pkg install kubeflow/tf-job ks generate core kubeflow-core --name=kubeflow-core ks apply default -c kubeflow-core
For Error rate limit, as follow:工具
https_proxy=http://192.168.199.99:9999 GITHUB_TOKEN=f7b4140133f6b77e6a987a0dae62db3551737*** ks pkg install kubeflow/core
若是有多個 Kubernetes 集羣,也能夠切換到其餘其集羣中部署,如學習
kubectl config use-context gke ks env add gke ks apply gke -c kubeflow-core
稍等一會,就能夠看到 tf-hub-lb
服務的公網 IP,也就是 JupyterHub 的訪問地址ui
kubectl get svc tf-hub-lb
對於不支持 LoadBalancer Service 的集羣,還能夠經過端口轉發(http://127.0.0.1:8100
)的方式來訪問:google
kubectl port-forward tf-hub-0 8100:8000
JupyterHub 默承認以用任意用戶名和密碼登陸。登錄後,能夠使用自定義鏡像來啓動 Notebook Server,好比使用
使用 CPU:
ks generate tf-cnn cnn --name=cnn ks apply gke -c cnn
使用 GPU:
ks param set cnn num_gpus 1 ks param set cnn num_workers 1 ks apply default -c cnn
MODEL_COMPONENT=serveInception MODEL_NAME=inception MODEL_PATH=gs://cloud-ml-dev_jlewi/tmp/inception ks generate tf-serving ${MODEL_COMPONENT} --name=${MODEL_NAME} --namespace=default --model_path=${MODEL_PATH} ks apply gke -c ${MODEL_COMPONENT}