Apache DataFu: LinkedIn開源的Pig UDF庫

介紹 Apache DataFu分兩部分,本文介紹的是其Pig UDF的部分。代碼在 Github上開源(除了代碼外。也有一些slides介紹鏈接)。 DataFu裏面是一些Pig的UDF。主要包含這些方面的函數: bags、geo、hash、linkanalysis、random、sampling、sessions、sets、stats、urls 每方面都相應一個package。 我把全部的函數
相關文章
相關標籤/搜索