Databook-數據之書

Databook-數據之書

用於數據分析的Jupyter Notebooks。html

快速建立步驟

  • 建立一個 github.com 帳號。
  • 複製本代碼倉庫到本身的repository,點擊fork便可。
  • 打開 https://mybinder.org , 填入上面的github repository地址,點擊「launch」開始構建本身的遠程服務。
  • 服務網頁打開後,將後綴/tree改成/lab,以使用最新的多窗口界面。
  • 添加notebook, 而後運行、修改,shift+enter便可執行cell中的代碼。
  • 提交更新到本身的 github repository, 經過運行 ./commit.sh。
  • https://github.com/databooks/databook 拉取更新, 運行 ./upstream-pull.sh.
  • 提交一個 pull-request, 將本身的 notebook 合併到上游 upstream, 須要從 github webUI上操做。

運行到k8s集羣

該項目能夠運行到本身的k8s集羣之中,須要構建從新爲jupyterhub-k8s構建鏡像和部署。   python

參考:git

快速使用教程

安裝的支持庫

  • jupyter, 包含 notebook, jupyterhub, jupyterlab webUI.
  • conda, 功能強大的python科學數據分析版, 使用 miniconda更小,只包含基本安裝包。
  • mlflow,使用 mlflow進行機器學習,該庫由databricks公司進行開發。
  • airflow, 數據流水線處理工具-airflow, 由Apache Software Foundation資助開發。
  • tushare, 金融數據獲取sdk,提供中國金融相關數據, 基於python api。
  • matplotlib, 圖形繪製庫,在 jupyter notebook 中使用,先執行 %matplotlib inline。
  • ipyleaflet , 在Jupyter Notebook中顯示地圖,提供jupyterlab extension, 是 jupyter-widgets的一部分。

更多資源

相關文章
相關標籤/搜索