一起hadoop(三)關於合併塊split

雷迪斯 街特悶, 上兩篇說道上傳,下面說一下,上傳後的處理。 需求:分析頁面中是否包含關鍵字。並返回頁面的路徑地址及名稱 首先: 上傳文件至HDFS,這一步看上一篇已經OK的。 接下來要做的事情,不只是查詢幾個單詞的事情了。   要做的事情:1.文件夾的讀取。                          2.頁面內容的讀取                          3.匹配    
相關文章
相關標籤/搜索