自定義udf函數的使用

自定義udf函數的使用 新建df1 和 df2 兩個數據源,指定數據源的中的列名和列的類型。用相同列「chanel_id」做關聯,進行join outer查詢, 在select取值的時候,用自定義的udf函數(get_channel_id),取兩個表中不爲空的「channel_id」作爲結果集的數據。 用fillna 替換結果集中的null值 from pyspark.sql.functions
相關文章
相關標籤/搜索