Application application_1512618719369_147804 failed 2 times due to ApplicationMaster for attempt app

今天遇到一個特別怪的問題,以前etl中的hive任務一直報錯,持續一上午,也沒有查出緣由,錯誤的任務的日誌也找到,本來能夠找到緣由,可是打開日誌,內心面一涼,什麼報錯也沒有,不知所錯。最後觀察報錯的節點,最終集中到兩臺機器,那就看看是否是這兩臺機器的hadoop的程序引發的嗎?看看他們的程序都在,可是查看nodemanager的日誌一直報錯,而且查看cpu,nodemanager進程佔用的cpu達1000%多,立刻眼前一亮,知道cpu佔用太多,致使ap不能聯繫,致使任務失敗,最後把這兩臺機器的nodemanager重啓一下,觀察了一下,任務不在報錯。繼續努力.............node

相關文章
相關標籤/搜索