推薦系統的技術棧

存儲系統:Habse是基於HDFS的一種數據庫,Hbase的文件是存儲在HDFS系統之上的。(解決了數據存儲問題) 採集組件:sqoop(針對RDMS關係型數據庫的數據進行採集,訂單,交易,還有瀏覽,收藏的) flume(實時的,比如用戶點擊的網頁的圖片和商品,這種點擊流) kaffka(第三方消息隊列框架,可靠性好) storm:流處理 Yarn:對資源進行分配,基於管理員配置的策略 HIve,
相關文章
相關標籤/搜索