完整數據團隊Tips(關於BI系統、數據倉庫、數據挖掘和數據實驗的27條建議)

參考The Strong Data Science Audit: How does your organization's data strategy stack up?一文web

分析和儀表盤

  1. 使用第三方獲取用戶行爲的工具?
    使用Google Analytics、Segment、Heap之類的工具。數據庫

  2. 有沒有明確的用戶行爲定義,仍是說只有PV?
    查看PV是瞭解用戶在作什麼的最快方法,可是還有其餘更重要的事。若是之後考慮到要升級網站或者APP,那麼最好的方法是將PV轉化成定義好的而且清晰的事件,例如註冊、購買等等。app

  3. 是否會查看單個用戶維度的行爲記錄,仍是隻是看整合的指標?
    整合統計只能讓你鳥瞰你的數據,對評估運營情況有利。可是更加有效的應該是查看每一個用戶歷時狀態下的行爲。這對於開發預測用戶模型和優化很是有利。機器學習

  4. 能不能監測用戶在每個app和web產品上的操做?
    對用戶的優化最好創建在全部平臺上。工具

  5. 是否有KPI(Key Performance Indicator,關鍵表現指標)?
    將你的數據轉化成KPI(清晰、有意義的指標,而且保障這些指標與大家公司的運營目標掛鉤),這樣有助於將數據更容易轉化爲行動。不少公司嘗試產生和儲存很是多的數據,而後將他們遞交給須要問題答案的業務部門。但好的公司是須要知道如何講數據轉化成簡單的KPI的。學習

  6. 是否每日跟蹤你的KPI,仍是經過一個工具,好比自動郵件或者儀表盤?
    經過數據庫或者表格並非一個有效的溝通方式。如今有不少多搭建dashboard的方案,好比MetabaseSuperset或者收費方案PeriscopeChartio測試

  7. 經理是否能夠客製化他們的數據試圖或者儀表盤?
    對小公司而言,展現一個儀表盤還OK。可是隨着公司的發證,不一樣的股東或者運營者想看到的是不一樣的數據試圖。所以,最好的方法是讓數據爲每個人提供服務,而且很好地客製化。優化

數據管道操做和數據倉庫

  1. 有人須要經過SQL獲取你的數據嗎?
    除了漂亮的可視化和摘要,須要直接地獲取你數據的工具,特別是你想讓你的模型和機器學習能夠更好地整合到公司業務中。網站

  2. 是否使用數據倉庫?
    整合全部數據能夠很方便地幫助以後的應用或者數據提供者中止服務。人工智能

  3. 是否儲存全部的用戶數據(即便暫時不用到它們)?
    有誰會知道如今的數據之後沒有用呢,雖然小數據也每每起到很大用處。

  4. 是否有備份和回覆措施?
    這是顯然的。

  5. 數據倉庫是不是雲服務可擴展的?
    這對成長期用戶很是關鍵,雲服務每每也能提供很好地可擴展性。

  6. 是否專人監控數據倉庫是否健康?
    你也能夠向外部團隊求助。

  7. 是否能夠自動檢測數據倉庫寫入中的失誤?
    好的系統應該自動告訴你這些寫入問題。

  8. 你的數據倉庫系統是否能承受如今100倍的用戶?
    搭建地系統不只爲了解決如今的問題,並且應該還包括將來的數據。

機器學習、預測和人工智能

  1. 是否用如今一直的因子(好比用戶人口特徵和經驗)去預測收入?
    必須用大量的所以探索公司業務中的各個環節的因果關係。

  2. 是否使用機器學習在你的產品中?
    機器學習能夠優化銷售、管理、UX等各個領域。在小公司中,這意味着能夠將小公司轉變爲更大公司的可能。

  3. 是否使用靈活的預測模型預測用戶行爲或者產出?

  4. 是否用預測模型來改善用戶體驗?

  5. 若是在電商平臺,是否能用個性化推薦來保證用戶的投入?

實驗和優化

  1. 是否執行一些測試實驗?
    講決策實驗化是一個現代數據驅動組織發展的關鍵。

  2. 是否使用實驗優化公司運營和溝通?

  3. 是否爲實驗提供了用以評估的KPI?

  4. 是否有一個方法能夠實現自動化部署和監控正在進行的實驗?

  5. 是否有合適統計驗證方法來評估實驗結果(而不是肉眼判斷)?

  6. 是否是在執行實驗前與訓練有素的統計學家或者實驗數據科學家溝經過,確保實驗有統計、推理的說服力?

  7. 是否有平臺能夠儲存或者分享研究結果?
    一個好的推薦是Airbnb最新開源的工具knowledge repo

相關文章
相關標籤/搜索