Spark Streaming foreachRDD的正確使用方式

誤區一:在driver上建立鏈接對象(好比網絡鏈接或數據庫鏈接) 若是在driver上建立鏈接對象,而後在RDD的算子函數內使用鏈接對象,那麼就意味着須要將鏈接對象序列化後從driver傳遞到worker上。而鏈接對象(好比Connection對象)一般來講是不支持序列化的,此時一般會報序列化的異常(serialization errors)。所以鏈接對象必須在worker上建立,不要在drive
相關文章
相關標籤/搜索