《白話大數據與機器學習》讀書筆記

1:大數據產業生產流程從數據的生命週期的傳導和演變上能夠分爲這樣幾個部分:數據收集、數據存儲、數據建模、數據分析、數據變現算法

3:大數據人才的一將難求不奇怪:(1)大數據產業發展迅速。(2)大數據人才培養成本居高不下。架構

3:大數據人才大體能夠分爲這三個方向:(1)偏重基建與架構的」大數據架構「方向。(2)偏重建模與分析的」大數據分析「方向。(3)偏重應用實現的」大數據開發「方向。大數據

 

195:經過某些手段對用戶作甄別,把他們分紅彼此相同或不一樣的人羣或個體,進而區別化提供服務和進行觀察分析——這一般是作用戶畫像的核心目的所在。網站

 

 

206:推薦系統做爲如今衆多電商系統、內容分發系統等網站的必要子系統,愈來愈受到運營者的重視。推薦系統核心要解決的問題是提升轉化率。spa

216:咱們指望的不是一個高度收斂的推薦算法,而是商品種類要豐富,也就是商品的覆蓋率要高,要保證它的多樣性生命週期

216:歸一化:對每一行的類似度值和當前行的最大值計算一個比值,把這個比值看成新的結果放在矩陣裏。 好處:全部原來類似度看上去比較低的值都被拉高了,縮小了差距。開發

289:指標的含義、指標的數量設置要合理,要讓這個指標的維護和解讀的成本與它的做用和收益相稱。數據分析

292:在作互聯網產品時千萬不要犯經驗主義的錯誤,經驗永遠是侷限的,惟一不變的東西就是變化自己。產品

293:灰度發佈:用策略文件進行控制,能夠僅對全網環境中的部分用戶——能夠是5%,能夠是10%,也能夠再多一些(可是這些數量級比封測和體服的數量級仍是大多了)進行更新,看看他們的反應。電商

293:不要小看這個簡單的東西,用得好會讓產品每次都能順利爬臺階,一步一步走向正確的方向,這比求助任何行業專家都要成本低並且反饋靈敏。

295:一切工做盡可能目標化和數字化。    能用圖的不要用表格,能用表格的不要用條目,能用條目的不要用段落。

相關文章
相關標籤/搜索