《Hadoop與大數據挖掘》一2.6.2 Hadoop TF-IDF編程思路

本節書摘來華章計算機《Hadoop與大數據挖掘》一書中的第2章 ,第2.6.2節,張良均 樊 哲 位文超 劉名軍 許國傑 周 龍 焦正升 著 更多章節內容可以訪問雲棲社區「華章計算機」公衆號查看。 2.6.2 Hadoop TF-IDF編程思路 這裏不再給出TF-IDF的單機算法實現,而直接給出其Hadoop算法實現思路,如圖2-52所示。 具體算法描述如下。 Job1:針對每個文件集中的每個輸入
相關文章
相關標籤/搜索