這段時間轉了一個小圈圈,發現又回來了,瞎忙。想要學習數據挖掘的小夥伴必定得對機器學習有所瞭解吧,我以前看過幾頁周志華老師的西瓜書,但終沒能堅持下來。編程
人生到處是起點,何時都不晚。記此筆記以分享與督促本身。瀏覽器
子曰「工欲善其事,必先利其器」。開始以前,先要選取一把上好的兵刃,才能練就神功,立足江湖。markdown
Python做爲機器學習的首選語言,天然是非它莫屬了。也許有的小夥伴和我同樣,對Python並不很熟悉,So what?現學現用吧。機器學習
No.1 Anaconda的安裝工具
機器學習選擇Python語言,除了簡單易用,就是Python有許多功能強大的庫,這些庫的管理和安裝很討厭,對我這樣的新手太不友好了。Anaconda能幫我搞定,裝完Anaconda,Python以及一些用於科學計算的庫都一步到位了,能夠直接開始愉快的學習之旅了。學習
蛇穴在哪裏?官網。看過一些視頻和博客說Anaconda的官網下載速度超慢,只有幾十K,可是,本人親測是很快的(1.8M左右)。spa
https://www.anaconda.com/distribution/命令行
有三種OS版本可供選擇,我裝的是Windows版本Python 3.7,Windows下程序的安裝就是一路的「下一步」,可是有個地方稍微留意一下,下圖:debug
這兩個選項全勾上吧,第一個是加入環境變量,第二個是默認使用 Python 3.7。點擊安裝,稍等一下便可完成安裝。3d
安裝完成後就能夠在Windows 開始菜單找到 Anaconda3 文件夾。
先啓動一下Anaconda Navigator,它是Anaconda發行包中的桌面圖形界面,能夠用來方便地啓動應用、管理conda包、環境和頻道,不須要使用命令行的命令。
那麼問題來了,在什麼地方擼代碼呢?看下Spyder和Jupyter notebook 。
直接在Navigator就能打開Spyder和Jupyter notebook ,在Windows開始菜單也能夠打開它們。
先瞄一眼Spyder,看樣子和傳統IDE差很少,菜單欄、工具欄、屬性頁巴拉巴拉的,有時間再好好用一下。
Jupyter notebook,這個東東讓我知道了一個新詞,叫「文學編程」,我理解的編程是按計算機的邏輯順序來編寫代碼,而後編譯執行,與此相反,文學編程則可讓人們按照本身的思惟邏輯來開發程序。Jupyter notebook能夠在WEB頁面裏編寫程序,支持實時代碼、數學方程和可視化,注意,它還能夠寫Markdown喲。
(小泥坑:用谷歌瀏覽器或360瀏覽器極速模式打開Jupyter,個人360瀏覽器默認兼容模式沒法打開Jupyter)
暫時體會:寫一行代碼,立刻能夠執行看效果,代碼能夠一行一行的執行,作數據處理和可視化就很方便,會很直觀。但若是代碼量比較大,debug就會有問題。
No.2 Jupyter notebook的簡單使用
點擊"Jupyter Notebook"進入,它會自動建立一個本地環境localhost,點擊右側的「New」就能夠新建一個想要的文件類型,能夠新建Python、Text文本、Folder文件夾、終端。固然,我主要是擼Python,建Python3便可。
新建一個Python3就會打開一個notebook頁面,頁面主要有四個部分:
notebook的名稱
菜單欄
工具欄
內容編輯區
Jupyter 的內容編輯主要是單元格(cell)組成,cell主要有兩種經常使用形式:
🅰代碼單元:這裏是編寫代碼的地方,經過按 Shift + Enter 運行代碼,其結果顯示在本單元下方。代碼單元左邊有 In[ ] 這樣的序列標記,方便查看代碼的執行次序。
🅱Markdown 單元:在這裏對文本進行編輯,採用 markdown 的語法規範,能夠設置文本格式、插入連接、圖片甚至數學公式。一樣使用 Shift + Enter 運行 markdown 單元來顯示格式化的文本。
有Markdown 在裏面,是否是感受有點文學編程的味道了。
來個栗子:
執行效果以下:
Jupyter中Cell 的一些簡單使用。
添加一個單元格(Cell):
菜單欄>>【Insert】
修改單元格(Cell)類型或運行單元格:
菜單欄>>【Cell】
最後
不知道有沒有小夥伴注意到,咱們擼的代碼存放在哪裏呢?怎麼將代碼文檔保存到自定義的路徑文件夾下呢?
點此 --> 修改 jupyter 的默認文件夾位置
-------------------------- END --------------------------