Jupyter Notebook(此前被稱爲 IPython notebook)是一個交互式筆記本,支持運行 40 多種編程語言。使用瀏覽器做爲界面,向後臺的IPython服務器發送請求,並顯示結果。 Jupyter Notebook 的本質是一個 Web 應用程序,便於建立和共享文學化程序文檔,支持實時代碼,數學方程,可視化和 markdown。 python
IPython 是一個 python 的交互式 shell,比默認的python shell 好用得多,支持變量自動補全,自動縮進,支持 bash shell 命令,內置了許多頗有用的功能和函數。shell
安裝ipython編程
windows: 前提是有numpy,matplotlib pandas json
採用pip安裝 pip install ipython
windows
OS X: AppStore下載安裝蘋果開發工具Xcode。瀏覽器
使用easy_install或pip安裝IPython,或者從源文件安裝。bash
安裝Jupyter notebook服務器
pip3 install jupytermarkdown
讀取與存儲csv:編程語言
# filepath 文件路徑。該字符串能夠是一個URL。有效的URL方案包括http,ftp和file # sep 分隔符。read_csv默認爲「,」,read_table默認爲製表符「[Tab]」。 # header 接收int或sequence。表示將某行數據做爲列名。默認爲infer,表示自動識別。 # names 接收array。表示列名。 # index_col 表示索引列的位置,取值爲sequence則表明多重索引。 # dtype 表明寫入的數據類型(列名爲key,數據格式爲values)。 # engine 接收c或者python。表明數據解析引擎。默認爲c。 # nrows 接收int。表示讀取前n行。 pd.read_table( filepath_or_buffer, sep='\t', header='infer', names=None, index_col=None, dtype=None, engine=None, nrows=None) pd.read_csv( filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, dtype=None, engine=None, nrows=None)
DataFrame.to_csv(excel_writer=None, sheetname=None, header=True, index=True, index_label=None, mode=’w’, encoding=None)
讀取與存儲excel:
# io 表示文件路徑。 # sheetname 表明excel表內數據的分表位置。默認爲0。 # header 接收int或sequence。表示將某行數據做爲列名。默認爲infer,表示自動識別。 # names 表示索引列的位置,取值爲sequence則表明多重索引。 # index_col 表示索引列的位置,取值爲sequence則表明多重索引。 # dtype 接收dict。數據類型。 pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None, dtype=None)
DataFrame.to_excel(excel_writer=None, sheetname=None, header=True, index=True, index_label=None, mode=’w’, encoding=None)
讀取與存儲JSON:
# 經過json模塊轉換爲字典,再轉換爲DataFrame pd.read_json('../ratings.json')