hive表數據更新的一種解決方案(使用spark進行)

hive對update和delete的支持不是很好,可是咱們能夠將這兩種操做轉化爲insert操做,查詢時取最新記錄來知足hive表數據更新的需求。web 思路: 爲每一張表增長兩個字段: updated:標記這次變動時間, 每次變動都須要填寫。 deleted: 標記這次記錄是否爲刪除操做,只需刪除的時候標記爲1便可。sql 舉例: 假設咱們原來有如下數據(主鍵爲id和id2):svg id n
相關文章
相關標籤/搜索