Jupyter notebook

Jupyter Notebook(此前被稱爲 IPython notebook)是一個交互式筆記本,支持運行 40 多種編程語言。使用瀏覽器做爲界面,向後臺的IPython服務器發送請求,並顯示結果。 Jupyter Notebook 的本質是一個 Web 應用程序,便於建立和共享文學化程序文檔,支持實時代碼,數學方程,可視化和 markdown。 python

IPython 是一個 python 的交互式 shell,比默認的python shell 好用得多,支持變量自動補全,自動縮進,支持 bash shell 命令,內置了許多頗有用的功能和函數。shell

安裝ipython編程

windows: 前提是有numpy,matplotlib pandas json

採用pip安裝 pip install ipythonwindows

OS X: AppStore下載安裝蘋果開發工具Xcode。瀏覽器

使用easy_install或pip安裝IPython,或者從源文件安裝。bash

安裝Jupyter notebook服務器

  pip3 install jupytermarkdown

數據讀取與存儲

讀取與存儲csv:編程語言

# filepath 文件路徑。該字符串能夠是一個URL。有效的URL方案包括http,ftp和file 
# sep 分隔符。read_csv默認爲「,」,read_table默認爲製表符「[Tab]」。
# header 接收int或sequence。表示將某行數據做爲列名。默認爲infer,表示自動識別。
# names 接收array。表示列名。
# index_col 表示索引列的位置,取值爲sequence則表明多重索引。 
# dtype 表明寫入的數據類型(列名爲key,數據格式爲values)。
# engine 接收c或者python。表明數據解析引擎。默認爲c。
# nrows 接收int。表示讀取前n行。

pd.read_table(
    filepath_or_buffer, sep='\t', header='infer', names=None, 
    index_col=None, dtype=None, engine=None, nrows=None) 
pd.read_csv(
    filepath_or_buffer, sep=',', header='infer', names=None, 
    index_col=None, dtype=None, engine=None, nrows=None)
DataFrame.to_csv(excel_writer=None, sheetname=None, header=True, index=True, index_label=None, mode=’w’, encoding=None) 

讀取與存儲excel:

# io 表示文件路徑。
# sheetname 表明excel表內數據的分表位置。默認爲0。 
# header 接收int或sequence。表示將某行數據做爲列名。默認爲infer,表示自動識別。
# names 表示索引列的位置,取值爲sequence則表明多重索引。
# index_col 表示索引列的位置,取值爲sequence則表明多重索引。
# dtype 接收dict。數據類型。
pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None, dtype=None)
DataFrame.to_excel(excel_writer=None, sheetname=None, header=True, index=True, index_label=None, mode=’w’, encoding=None) 

讀取與存儲JSON:

# 經過json模塊轉換爲字典,再轉換爲DataFrame
pd.read_json('../ratings.json')
相關文章
相關標籤/搜索