Spark基於搜狗日誌數據分析

針對搜狗實驗室的語料數據-用戶查詢日誌(網頁搜索用戶查詢及點擊記錄)進行Spark數據分析。 Data 簡介 搜索引擎查詢日誌庫設計爲包括約1個月(2008年6月)Sogou搜索引擎部分網頁查詢需求及用戶點擊情況的網頁查詢日誌數據集合。爲進行中文搜索引擎用戶行爲分析的研究者提供基準研究語料。 格式說明:數據格式爲訪問時間\t用戶ID\t[查詢詞]\t該URL在返回結果中的排名\t用戶點擊的順序號\
相關文章
相關標籤/搜索