經過單擊流分析肯定熱門主題

本文將帶領你們使用 Apache Spark 和 Kafka 收集、分析和報告網站訪問者數據html

概覽

點擊流分析是收集、分析和報告用戶訪問了哪些網頁的過程,能夠提供有關網站使用特徵的有用信息。測試

點擊流分析的一些流行用例包括:網站

  • A/B 測試 – 統計分析從版本 A 更改到 B 對網站的用戶有何影響。
  • 在購物門戶上生成推薦 – 購物門戶網站用戶的點擊模式代表了用戶是受何種影響才購買某款商品的。此信息可用來爲將來的相似點擊模式生成推薦。
  • 針對性廣告 – 相似於推薦生成,但跟蹤用戶的跨網站點擊,並利用此使投放的廣告更實時準確。
  • 熱門主題 – 可以使用點擊流分析來實時分析或報告熱門主題。對於某個特定的時間段,顯示得到用戶點擊次數最多的熱門項目。

在本 Code Pattern 中,咱們將演示如何檢測 Wikipedia 上的實時熱門主題。要執行此任務,將會使用 Apache Kafka 做爲消息隊列,使用 Apache Spark 結構化流引擎來執行分析。這種組合因其實用性、高吞吐量和低延遲特徵而聞名。spa

完成本 Code Pattern 後,您將掌握如何:.net

  • 使用 Jupyter Notebook 加載、可視化和分析數據。
  •  IBM Watson Studio 中運行 Jupyter Notebook。
  • 使用 Apache Spark 結構化流執行點擊流分析。
  • 利用 Apache Kafka 構建一個低延遲處理流。

相關演示視頻視頻

http://v.youku.com/v_show/id_XMzUwODg1NzE4OA==.htmlhtm

 

當即註冊體驗點擊這裏隊列

更多內容點擊進入ip

相關文章
相關標籤/搜索