【深度】Kubernetes在京東人工智能平臺的應用

「目前Kubernetes是容器圈裏的「當紅炸子雞」,京東人工智能平臺——登月中也大量應用了Kubernetes。在京東資深架構師範振看來,登月平臺的設計出發點就是Kubernetes調度一切。」網絡

在京東,分佈式機器學習平臺已經應用於包括電商,金融等多個應用場景。「咱們將在9月16日,北京,國家會議中心舉辦的京東技術開放日——人工智能平臺的系統架構與數據處理專場中,專題分享Kubernetes在京東人工智能平臺的應用。」架構

圖片描述

範振談到:「包括將學習任務分配到集羣的物理節點上進行運算,若是遇到任務失敗的狀況,Kubernetes 會自動重啓任務;以及Kubernetes能夠把不少併發進程組織成service,而且實現auto scaling——白天用戶數量多的時候,增長Web service裏的進程數,減小AI做業的進程數。晚上減小Web service裏的進程數,釋放資源給AI做業,提高機器資源利用率和下降基礎設施成本。」併發

這些內容都將在9月16日,北京,國家會議中心舉辦的京東技術開放日上作專題分享。機器學習

人工智能的集中式爆發,機器學習的訓練過程對於快速迭代的高要求,讓可以輕量級接入,而且能夠對用戶提供秒級響應的Kubernetes發揮了巨大的優點。師出同門的Google Tensorflow項目很早也進行了與Kubernetes的集成,京東的人工智能平臺上實現了Spark on Kubernetes。分佈式

從Kubernetes的角度出發,把Driver和Executor分別Container化,完成Spark的原生調度,架構更清晰。同時,繼承了Docker的計算資源隔離性,經過Kubernetes的Namespace,將不一樣的Job從網絡上完全隔離。學習

圖片描述

在9月16日,北京,國家會議中心舉辦的京東技術開放日上,這些你們關注的熱點內容,都將在活動現場精彩呈現。人工智能

範振認爲,將來Kubernetes也可能會成爲雲管理平臺的統治者,也還會有更多的應用在Kubernetes上原生運行起來。由於對於Kubernetes,它能夠把不少分散的物理計算資源抽象成一個大的資源池,利用這些資源來執行用戶的計算任務。對於用戶來講,操做一個分散的集羣資源就像在使用一臺計算機。 spa

實際上,Kubernetes不只簡單的解決了容器的部署和運行問題,它還關注如何幫助用戶構建容器化分佈式服務這個問題。所以9月16日,北京,國家會議中心舉辦的京東技術開放日對於在容器化道路上還在「摸着石頭過河」的用戶來講,也是頗有價值的。設計

「Kubernetes做爲一個快速演進的項目,應用起來潛在的坑仍是不少的。本次京東技術開放日上的Kubernetes議題,就是在你作爲應用新技術方面,能夠借鑑的很好的一次經驗分享。」 ——京東副總裁 翁志
圖片描述繼承

相關文章
相關標籤/搜索