如下都是胡說八道,僅供我我的參考。web
自從我改行作數據分析,發現要學習的東西不少,轉行並非一件容易的事情。空缺的知識特別多。因此本身記錄本身的一些學習和工做心得。算法
一、總得來講數據分析流程就3個基本步驟:架構
輸入-->計算-->輸出學習
因此在數據分析中無論是作架構設計仍是算法設計這三個基本步驟是不可缺乏的;彷彿咱們的計算機也是這個最基本的運行流程。架構設計
1、輸入:設計
那麼在數據分析領域咱們輸入的是什麼呢視頻
固然是數據,文本數據,結構化數據,非結構化數據(音頻、視頻),具體對象是咱們在數據分析中的表數據,或者數據流。對象
從這些表中,數據分析
第一步,摸排表結構,瞭解各字段含義;提取關鍵字段,這些字段都是有用的,構成一個對象的屬性。沒用的字段不必太理會,這個地方和作其餘web應用的有所不一樣。音頻
第二步,找出惟一屬性,能惟必定義每一條數據的,這個字段每每能和其餘表的字段關聯;
2、計算:
計算大多數時候是交,並、差、過濾等操做。可具體描述數據碰撞流程。
3、輸出:
計算完須要用一個結果表將數據接收。