在使用spark-streaming的時候,調用了spark-sql,會執行hive語句,這個時候在hive的目錄下回產生不少.staging_hive文件,並且是操做哪一個表,就在哪一個表中產生。hive也會產生.staging_hive,可是hive產生後會被移除,而spark-sql不會移除,因此咱們須要手動處理這種狀況。sql
<property> <name>hive.exec.stagingdir</name> <value>/tmp/staging/.hive-staging</value> </property>
參考:
hive任務中MoveTask的策略
hive insert overwrite1.2.1 沒法刪除舊文件的問題shell