spark RDD進行行轉列而且生成惟一標識

好比說像這樣的一條數據:apache ("1",Seq("你好","我愛")) 想轉化爲以下形式:spa (1,你好) (1,我愛) 直接擼代碼:code  這裏面的轉化看懂了麼。其實很簡單,生成一個List,List((1,你好), (1,我愛)),而後就是wordcount裏面使用的flatMap把list打扁生成一個大的list。而後使用zipWithIndex生成一個有序id,必定要col
相關文章
相關標籤/搜索