GraphX對edgelist文件格式的要求

前陣子踩過的一個坑,發朋友圈了,轉過來記錄一下。 是關於GraphX讀取edgelist文件失敗的問題,報invalid line錯誤。後來從《Spark GraphX圖計算核心源碼分析【圖構建器、頂點、邊】》查到,GraphX能識別的edgelist文件的格式,兩列之間用一個或多個空格分隔,而不能是用逗號分隔的csv。如下圖所示。973GB的文件再處理一遍我找誰說理去。。。。。
相關文章
相關標籤/搜索