spark一個奇怪的bug

見下面代碼: val right_rdd=rightplan.execute() val right_result=right_rdd.collect()rightplan是一個SparkPlan,若直接collect取數據,則取到的數據集是每一個分區內部的最後一條數據*分區內的總記錄個數: 可是單獨取InternalRow行內的數據的話,是能夠取到的,真實數據集是: collect先後取save
相關文章
相關標籤/搜索