微博廣告推薦中有關Hadoop的那些事

一、背景 微博,一個DAU上億、每日發博量幾千萬的社交性產品,擁有龐大的數據集。如何高效得從如此規模的數據集中挖掘出有價值的信息,以增強用戶粘性,提高信息傳播速度,就成了重中之重。因此,引入了hadoop分佈式計算平臺,對用戶數據和內容數據進行分析和挖掘,作爲廣告推薦的基礎。 二、問題及解決方案 在hadoop平臺上進行開發時,主要遇到了以下一些問題: 2.1 數據量龐大 問題:無論在進行鍼對用戶
相關文章
相關標籤/搜索