NLTK使用Hive UDF

可以使用各種各樣的方法,使NLTK運行在Hadoop上。通過進行詞語標記,同時並行使用Hive UDF,探討一個使用NLTK的示例。 對於這種用例,必須遵循以下步驟。 (1)我們已經選擇了一個小數據集,在這個數據集中只有兩列。必須使用Hive創建相同的模式(Schema)。
相關文章
相關標籤/搜索