1mysql 2linux 3sql 4shell 5json 6session 7數據結構 8架構 9dom 10網站 11 12 |
|
1 2 3 4 5 6 |
|
task表(mysql表)
1 2 3 4 5 6 7 8 |
|
1.j2ee平臺的使用者,向平臺提交任務(包含任務參數),並將任務插入到mysql表中的task表
2.Runtime,Process等API去執行一個封裝了spark-submit命令的linux的shell腳本
3.而後編寫jar提交spark集羣中運行
1.搜索過某些關鍵詞的用戶
2.訪問時間在某個時間段內的用戶
3.年齡在某個範圍內的用戶
4.職業在某個範圍內的用戶
5.某個城市發起的session
功能做用:對感興趣的用戶羣體進行業務分析
功能做用:從全局的角度,符合某些條件的用戶羣體,使用咱們的產品的一些習慣
功能做用:對於符合條件的session,按照時間比例採樣,具體觀察每一個session的點擊流行爲
數據表結構設計(MySQL面向結果)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
|
1 2 3 4 5 6 7 8 |
|
1 2 3 4 5 6 7 8 |
|
1 2 3 4 5 6 7 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|