你們好,我是東哥。html
常常給你們推薦好用的數據分析工具,也收到了鐵子們的各類好評。此次也不例外,我要再推薦一個,並且是個爆款神器。python
Excel
和Jupyter Notebok
都是我天天必用的工具,並且兩個工具常常協同工做,一直以來工做效率也還算不錯。但說實在,畢竟是兩個工具,使用的時候確定會有一些切換的成本。app
最近,在逛GitHub忽然發現了一款神器「PyXLL-Jupyter」,它能夠完美將Jupyter Notebook
嵌入到Excel中!
是的,你沒聽錯,使用它咱們就可在Excel
中運行Jupyter Notebook
,調用Python函數,實現數據共享。編輯器
首先,想要在Excel中運行Python代碼,須要安裝PyXLL
插件。PyXLL
能夠將Python集成到Excel中,用Python
替代VBA
。ide
先用 pip 安裝 PyXLL
。函數
pip install pyxll
而後再用PyXLL
獨特的命令行工具安裝Excel插件。工具
>> pyxll install
安裝好了PyXLL
在 Excel中的插件,下一步就是安裝pyxll-jupyter
軟件包了。使用pip安裝pyxll-jupyter
軟件包:性能
pip install pyxll-jupyter
安裝完畢後,啓動Excel,將在PyXLL
選項卡中看到一個新的Jupyter
按鈕。學習
單擊此按鈕可在Excel工做簿的側面板中打開Jupyter Notebook。該面板是Excel界面的一部分,能夠經過拖放操做取消停靠或停靠在其餘位置。測試
在Jupyter面板中,你能夠選擇一個現有的Notebook或建立一個新的Notebook。建立一個新的Notebook,選擇新建按鈕,而後選擇Python 3
。
這樣作有什麼用處呢?
好比,咱們要將數據從Excel導入Python。
因爲Excel和Python已經在同一進程中運行了,因此在Python中訪問Excel數據以及在Python和Excel之間切換很是快。
更牛X的是,pyxll-jupyter
還單獨附帶了一些IPython
魔法函數,輸入後一鍵便可完成同步。
%xl_get
將Python中的數據移到Excel,也是同理,很是簡單。
不管是使用Python先加載數據集,再傳輸到Excel,仍是其它形式,從Python複製數據到Excel很是容易。
%xl_set
固然,%xl_get
和%xl_set
都附帶參數選項能夠自定義導入導出規則。
PyXLL
的另外一大用處就是它集成了幾乎全部主流的可視化包,所以咱們能夠在Excel中利用這些可視化包隨意繪圖,包括matplotlib
、plotly
、bokeh
和altair
等。
%xl_plot
一樣,使用魔法函數%xl_plot
在Excel中能夠繪製任何的Python圖。任何一個受支持的可視化包也可進行繪圖而後傳遞圖形對象到Excel中,好比上圖中使用pandas的繪圖效果就很好。
%xl_plot df.plot(kind='scatter')
使用Excel離不開函數,而當咱們須要一些複雜功能時,自帶函數未必能知足咱們的需求。
經過PyXLL
,咱們能夠直接在Excel
中調用Python
函數,並對其進行實時測試。這就避免了Excel和Jupyter之間的來回切換成本,有點像dataframe的apply
用法,寫個函數直接與Excel
完美融合。
函數寫好後,還可將其添加到PyXLL Python
項目中。這樣之後每次均可以複用實現相同功能,簡直不要太香!
from pyxll import xl_func @xl_func def test_func(a, b, c): return (a * b) + c
好比,輸入以上代碼在Jupyter
中運行後,Python函數將當即可被Excel工做簿調用。
不僅是簡單的函數,還能夠將整個數據做爲pandas
的DataFrames
傳給函數,並返回任何的Python類型,好比numpy array
、DataFrames
,甚至還能夠經過給@xl_func
裝飾器一個簽名字符串來告訴PyXLL輸出什麼類型。例如,如下函數:
from pyxll import xl_func # 裝飾器簽名告訴 PyXLL 如何轉換函數參數和返回的值 @xl_func("dataframe df: dataframe<index=True>", auto_resize=True) def df_describe(df): # df 是一個從數據集裏建立的 pandas DataFrame 傳遞給函數 desc = df.describe() # desc 是新的 DataFrame(PyXLL轉換爲一組值並返回給Excel所建立的) return desc
如今能夠編寫複雜的Python函數來進行數據轉換和分析,可是能夠協調在Excel中如何調用或排序這些函數。更改輸入會致使調用函數,而且計算出的輸出會實時更新,這與咱們指望的同樣。
VBA腳本所需的功能函數,在Python中均有相同的API。這對於熟悉Python但不熟悉VBA的同窗絕對是個好消息。
官網還給出了和VBA功能同樣的API說明文檔。
https://www.pyxll.com/docs/us...
Jupyter Notebook
在Excel中運行,整個Excel對象均可用,全部操做就像在VBA
編輯器中編寫Excel
腳本如出一轍。
因爲PyXLL
在Excel進程內運行Python ,所以從Python調用Excel不會對性能形成任何影響。固然,也能夠從外部Python進程調用Excel,但這一般要慢不少。在Excel中運行Jupyter Notebook
,一切變得就不同了!
使用PyXLL
的xl_app
函數獲取Excel.Application
對象,該對象等效於VBA
中的Application
對象。弄清楚如何使用Excel對象模型進行操做的一種好方法是記錄VBA
宏,而後將該宏轉換爲Python
。
下圖中嘗試將當前選擇單元格更改顏色。
PyXLL
將完美融合Python
和Excel
,實現瞭如下功能,爲表格數據處理提高一個全新的高度。
不得不說這個工具是真的香,喜好Python的同窗能夠不用學習VBA了,Python腳本打天下。
原創不易,以爲不錯點個贊。
另外,歡迎關注個人原創公衆號:Python數據科學
數據科學學習網站:datadeepin