Spark讀取文本文件並轉換爲DataFrame

本文首發於個人我的博客QIMING.INFO,轉載請帶上連接及署名。正則表達式 Spark ML裏的核心API已經由基於RDD換成了基於DataFrame,爲了使讀取到的值成爲DataFrame類型,咱們能夠直接使用讀取CSV的方式來讀取文本文件,可問題來了,當文本文件中每一行的各個數據被不定數目的空格所隔開時,咱們沒法將這些不定數目的空格看成CSV文件的分隔符(由於Spark讀取CSV文件時,不
相關文章
相關標籤/搜索