UDF很慢

2018/04/23 大部分時候,都是用的spark內置的命令。什麼記個數,什麼作個sql,這種概念。 即便是上了我全部的數據集,也不會特別慢。 可是自從我上了這個udf以後,就變得很慢了。每次運行個二十多分鐘,這個就有點無法忍受了。 可是仍是不能理解,究竟是什麼部分致使我變慢了。這個階段的優化的話,就真的是語言級別的優化了,總體說底層架構的東西已經都優化好了,可是對於語言來講,仍是沒有優化。 不
相關文章
相關標籤/搜索