Spark 中幾個 join 算子

Spark 中和 join 相關的算子有這幾個:joinfullOuterJoinleftOuterJoinrightOuterJoinsql

這幾種 join 算子和 sql 中的 join 相似,join 至關於內鏈接,fullOuterJoin 至關於全鏈接,leftOuterJoin 至關於左鏈接,rightOuterJoin 至關於右鏈接。spa

分別解釋下這幾種鏈接在 sql 中的含義,spark 中類推:code

  1. 內鏈接:若是表中有至少一個匹配,則返回行。
  2. 左鏈接:即便右表中沒有匹配,也從左表返回全部的行。
  3. 右鏈接:即便左表中沒有匹配,也從右表返回全部的行。
  4. 全鏈接:只要其中一個表中存在匹配,則返回行。

直觀點看圖:cdn

sql join 圖解
相關文章
相關標籤/搜索