Yarn-NodeManager分給Container虛擬內存不足導致Container自殺

一、問題再現 由於項目需要,採購電信天翼雲,由於是新搭建的集羣,在yarn上跑Spark任務時,每個幾個小時或者半天出現節點丟失(Lost Nodes),訪問http://cloudera01:8088,如下圖,可以看到2個節點和集羣失去了聯繫   二、問題排查 1、登錄cm管理界面 首先登錄cm管理界面,去查看yarn的運行狀況,看到2個NodeManager運行不良,點擊不良鏈接 2、點擊No
相關文章
相關標籤/搜索