學習《精通特徵工程》中文PDF+英文PDF+代碼對比

特徵工程是機器學習流程中相當重要的一個環節,這方面的書較少,推薦學習《精通特徵工程》,着重闡明特徵工程的基本原則,介紹大量特徵工程技術,學習從原始數據中提取出正確的特徵並將其轉換爲適合機器學習模型的格式,從而輕鬆構建模型,加強機器學習算法的效果。程序員

《精通特徵工程》並不是單純地講述特徵工程的基本原則,而是經過大量示例和練習將重點放在了實際應用上。每一章都集中研究一個數據問題:如何表示文本數據或圖像數據,如何爲自動生成的特徵下降維度,什麼時候以及如何對特徵進行標準化,等等。最後一章經過一個完整的例子演示了多種特徵工程技術的實際應用。全部代碼示例均是用Python編寫的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。算法

學習參考:編程

《精通特徵工程》中文PDF,178頁,帶書籤目錄,文字能夠複製。
《精通特徵工程》英文PDF,217頁,帶書籤目錄,文字能夠複製。
配套源代碼。網絡

下載: https://pan.baidu.com/s/1t7UrvCdzVD4yQ2v6VZueNQ
提取碼: i49z框架

 

學習內容:機器學習

數值型數據的特徵工程:過濾、分箱、縮放、對數變換和指數變換
天然文本技術:詞袋、n元詞與短語檢測
基於頻率的過濾和特徵縮放工具


分類變量編碼技術:特徵散列化與分箱計數
使用主成分分析的基於模型的特徵工程
模型堆疊與k-均值特徵化
圖像特徵提取:人工提取與深度學習學習

特徵工程用於機器學習中,學習機器學習推薦看看《機器學習實戰》優化

下載: https://pan.baidu.com/s/16Ji-HGhJGSeniAlq8StoCg
提取碼: gf75編碼

《機器學習實戰》中文PDF,336頁,帶書籤目錄,文字可複製。

《機器學習實戰》英文PDF,382頁,帶書籤目錄,文字可複製,彩色配圖。
配套源代碼。

第一部分主要介紹機器學習基礎,以及如何利用算法進行分類,並逐步介紹了多種經典的監督學習算法,如k近鄰算法、樸素貝葉斯算法、Logistic迴歸算法、支持向量機、AdaBoost集成方法、基於樹的迴歸算法和分類迴歸樹(CART)算法等。

第三部分則重點介紹無監督學習及其一些主要算法:k均值聚類算法、Apriori算法、FP-Growth算法。第四部分介紹了機器學習算法的一些附屬工具。經過精心編排的實例,切入平常工做任務,摒棄學術化語言,利用高效的可複用Python代碼來闡釋如何處理統計數據,進行數據分析及可視化。經過各類實例,讀者可從中學會機器學習的核心算法,並能將其運用於一些策略性任務中,如分類、預測、推薦。另外,還可用它們來實現一些更高級的功能,如彙總和簡化等。

 國內的機器學習書推薦學習周志華老師的《機器學習》,《機器學習》做爲該領域的入門教材,在內容上儘量涵蓋機器學習基礎知識的各方面。 爲了使盡量多的讀者經過本書對機器學習有所瞭解, 做者試圖儘量少地使用數學知識. 然而, 少許的機率、統計、代數、優化、邏輯知識不可避免,附錄給出了一些相關數學基礎知識簡介.

 

《機器學習》PDF,周志華著,443頁,帶書籤目錄,文字能夠複製。
配套《機器學習》筆記;
配套《機器學習》課件;
配套《機器學習》習題部分解答及代碼。

下載: https://pan.baidu.com/s/1hy7iL8oO3Z0CSG36dOfZqg
提取碼: y36q


《機器學習》共16 章,大體分爲3 個部分:第1 部分(第1~3 章)介紹機器學習的基礎知識;第2 部分(第4~10 章)討論一些經典而經常使用的機器學習方法(決策樹、神經網絡、支持向量機、貝葉斯分類器、集成學習、聚類、降維與度量學習);第3 部分(第11~16 章)爲進階知識,內容涉及特徵選擇與稀疏學習、計算學習理論、半監督學習、機率圖模型、規則學習以及強化學習等.前3章以外的後續各章均相對獨立, 讀者可根據本身的興趣和時間狀況選擇使用. 根據課時狀況, 一個學期的本科生課程可考慮講授前9章或前10章; 研究生課程則不妨使用全書.

書中除第1章外, 每章都給出了十道習題. 有的習題是幫助讀者鞏固本章學習, 有的是爲了引導讀者擴展相關知識. 一學期的通常課程可以使用這些習題, 再輔以兩到三個針對具體數據集的大做業. 帶星號的習題則有至關難度, 有些並沒有現成答案, 謹供富有進取心的讀者啓發思考.

 學習機器學習時,國外有不少教程講的不錯,可是提供的例子感受老是不太合適,相比而言,國內教材中一些示例仍是挺實用的,推薦一本很是好的機器學習入門和實踐的書籍《機器學習—Python實踐》。

學習參考:
《機器學習Python實踐》PDF,227頁,帶目錄,文字能夠複製;配套源代碼;做者:魏貞原

下載: https://pan.baidu.com/s/1ei3L4zeG1UJYbZYjYFJ1BA
提取碼: is7c

 

《機器學習—Python實踐》以實踐爲導向,使用 scikit-learn 做爲編程框架,強調簡單、快速地創建模型,解決實際項目問題。經過對《機器學習——Python實踐》的學習,能夠迅速上手實踐機器學習,並利用機器學習解決實際問題,很是適合於項目經理、有意從事機器學習開發的程序員,相關專業人士閱讀。

 

TF方面推薦學習參考《TensorFlow進階指南:基礎、算法與應用》,詳細地解析了使用TensorFlow進行深度學習領域中經常使用模型的搭建、調參和部署整個流程,以及數據集的使用方法,可以幫助快速理解和掌握TensorFlow相關技術,最後還用實戰項目幫助快速地學會TensorFlow開發,並使用TensorFlow技術來解決實際問題。

《TensorFlow進階指南基礎算法與應用》PDF,374頁,帶書籤目錄,文字能夠複製。
配套源代碼;做者:黃鴻波

下載: https://pan.baidu.com/s/1kUOna7OhUEqmlQ-cIzt-PQ
提取碼: pny6

相關文章
相關標籤/搜索