Hive源碼分析(1)——HiveServer2啓動過程

時間 2021-03-16

標籤 node web 緩存 session spa 線程 3d 日誌 server 對象欄目 Hadoop 简体版

原文原文鏈接

1.想了解HiveServer2的啓動過程，則須要找到啓動HiveServer2的入口，hive服務的啓動命令爲hive --service HiveServer2，經過分析$HIVE_HOME/bin下hive腳本可知，執行hive --service HiveServer2後正真調用的是$HIVE_HOME/bin/ext下的hiveserver2.sh腳本，而從hiveserver2.sh腳本能夠看出，hive服務的入口爲HiveServer2類，所以咱們須要經過分析HiveServer2類來了解hive的啓動過程。node

2.入口方法web

在HiveServer2類的入口方法爲main方法，該方法中作了如下幾件事：緩存

1）設置加載hive配置的標識的值爲truesession

2）構造ServerOptionsProcessor對象，並調用該對象的parse()方法解析參數spa

3）調用LogUtils.initHiveLog4j()方法初始化hive日誌線程

4）基於命令解析結果獲取執行器，並調用execute()方法啓動HiveServer2服務3d

注：在執行以上四個步驟時，一旦捕獲到異常就會執行System.exit(-1)退出程序。日誌

瞭解了main()的大體邏輯，接下來分析每一個步驟的具體實現。server

1.ServerOptionsProcessor的parse()方法對象

在parse()方法中先會經過new GnuParser().parse()方法將參數解析爲CommandLine對象，而後調用CommandLine的getOptionProperties()獲取hive的配置，並將這些配置設置到系統屬性中，最後根據參數選項選取對應的處理器，並返回對應的參數處理的response結果，主要包括5種狀況：

1）當參數選項爲H時，處理器爲HelpOptionExecutor，即經過打印用法來執行--help選項；

2）當參數選項爲deregister時，處理器爲DeregisterOptionExecutor，即經過從特定版本的ZooKeeper中註銷全部HiveServer2實例來執行--deregister選項；

3）當參數選項爲listHAPeers時，處理器爲ListHAPeersExecutor，

4）當參數選項爲listHAPeers時，處理器爲FailoverHS2InstanceExecutor

接下來直接查看StartOptionExecutor類的execute方法，以下所示：

該方法的核心是1305行startHiveServer2()方法，進入該方法，能夠看到該方法裏的全部邏輯都包含在一個while(true)中，這樣作的目的是在HiveServer2失敗後增長重試操做，那什麼會結束該while循環呢？有兩種狀況，一種是在限制的次數內執行啓動成功，一種是重試次數用完還未執行成功，重試次數爲默認值爲30秒，重試間隔時間爲60秒，可經過配置進行修改，而後來看主要啓動邏輯。

1）啓動hive以前先清除hive緩存目錄（/tmp/hive）

根據hive.start.cleanup.scratchdir的值判斷是否須要清理，默認值爲false。若是爲true，則會根據hive.exec.scratchdir配置的臨時目錄的值，調用hdfs接口來刪除該路徑，以下圖所示：