那特徵工程究竟是什麼呢?顧名思義,其本質是一項工程活動,目的是最大限度地從原始數據中提取特徵以供算法和模型使用。文中分享了人們對特徵工程的概括和總結以及一些數據處理。
python
很是全面的一篇學習資料
git
關於 Kaggle 的簡介
程序員
你在工做、學習中是否曾因信息過載叫苦連天?有一種方法可以替你讀海量文章,並將不一樣的主題和對應的關鍵詞抽取出來,讓你談笑間觀其大略。本文使用Python對超過1000條文本作主題抽取,一步步帶你體會非監督機器學習LDA方法的魅力。想不想試試呢?
github
Scikit-learn 祕籍 第五章 模型後處理
面試
這篇文章向你們推薦一份用戶友好型的機器學習教程。
算法
Awesome-TensorFlow-Chinese,TensorFlow 中文資源精選,官方網站,安裝教程,入門教程,實戰項目,學習路徑。
數據庫
做爲一個非 CS 科班的互聯網從業者,確實對於 AI 這個領域一直遠而避之,想了想高數,建模,大數據,算法這些詞彙,都會有點頭髮麻的感受。可是又不能徹底不懂吧,本身打算寫下這個 List,用於蒐集科普性的人工智能領域的文章,但願和你們一塊兒學習。但願也能夠快點加入這個熱門的圈子。
編程
這篇文章根據做者自己學習計算機科學的經驗,給出了學習機器學習理論的這一系列文章,可以填補自主學習機器學習的理論與實踐之間的差距,從而在征途上少一些艱辛。
網絡
一份較全面的機器學習的學習資料,涵蓋了 Awesome 系列,Deep Learning,Frameworks,TensorFlow,RNN & LSTM 等等。
app
機器學習、深度學習與天然語言處理領域推薦的書籍列表 是筆者 Awesome Reference 系列的一部分;對於其餘的資料、文章、視頻教程、工具實踐請參考面向程序猿的數據科學與機器學習知識體系及資料合集。本文算是拋磚引玉,筆者最近有空就會在 Pad 上面隨手翻閱這些書籍,但願可以瞭解其餘優秀的書籍。
我認爲李老師的課程風格風趣幽默而又很是負責,既能融入Pokemon等有趣的applications,也會用十幾張PPT來細緻地推導公式算法。
很是推薦你們用李宏毅老師的課程來入門,特別是對英語基礎不夠紮實的同窗,固然主流Coursera、Udacity的課程也是很是專業而全面的。
好文章
本文的重點是實現,並不會從理論和概念上詳細解釋深度神經網絡、卷積神經網絡、最優化方法等基本內容。可是機器之心發過許多詳細解釋的入門文章或教程,所以,咱們但願讀者能先了解如下基本概念和理論。固然,本文注重實現,即便對深度學習的基本算法理解不那麼深一樣仍是能實現本文所述的內容。
A Mindmap summarising Machine Learning concepts, from Data Analysis to Deep Learning.
Machine Learning is a subfield of computer science th…
【數據分析師的基本素養】論如何成爲一名數據科學家
http://click.aliyun.com/m/10280/
這是本人在知乎上翻譯的文章, 陸續更新中,如今搬運到掘金上來。 在這一系列文章中,你將學到深度學習的一些基本概念以及TensorFlow的使用,並完成手寫體數字識別、圖像分類、遷移學習、Deep Dream、風格遷移和強化學習等項目。 github上的Python NoteBoo…
機器學習的數據分爲三類:訓練集、驗證集和測試集,剛開始看 tensorflow 時一直沒搞懂驗證集是作什麼的。
AUC值 Area Under Curve score (曲線下面積值),也就是ROC曲線之下與座標軸圍成的面積。 這兩個指標通常做爲衡量二分類器的度量,爲何要有這個測試指標,源自於一種二分類器的思考。若是咱們有一件事情的爲1的機率爲99%,0的機率爲1%,則若是咱們不通過處…
不一樣於其餘KNN的入門,這篇文章直接採用卷積神經網絡介紹機器學習。好像不學點機器學習就很虧?
從基礎到進階,還有做者分享的一些資源。
背景:一直有朋友但願我能介紹下自學機器學習、數據挖掘的經歷,然而當我認真回首研究生這兩年半,發現浪掉的時間居多,學習的時間太少,積累還不夠(雖然校招季收穫比較多的數據挖掘相關offer,其實人脈、運氣、面試經驗等其餘因素佔了很大比重)。因此在此只能聊聊一些淺顯的認識,各位姑妄聽之。
本文受衆:有興趣自學機器學習、數據挖掘的學生或程序員(也歡迎科班研究生、業界大拿拍磚,多多提出批評建議,先行謝過)
Python 能夠說是如今最流行的機器學習語言,並且你也能在網上找到大量的資源。你如今也在考慮從 Python 入門機器學習嗎?本教程或許能幫你成功上手,從 0 到 1 掌握 Python 機器學習,至於後面再從 1 到 100 變成機器學習專家,就要看你本身的努力了。
介紹:這是一篇介紹機器學習歷史的文章,介紹很全面,從感知機、神經網絡、決策樹、SVM、Adaboost到隨機森林、Deep Learning.
《Deep Learning in Neural Networks: An Overview》 介紹:這是瑞士人工智能實驗室Jurge…
本文用一系列「思惟導圖」由淺入深的總結了「統計學」領域的基礎知識
在機器學習和數據挖掘的應用中,scikit-learn 是一個功能強大的 python 包。在數據量不是過大的狀況下,能夠解決大部分問題。學習使用 scikit-learn 的過程當中,我本身也在補充着機器學習和數據挖掘的知識。這裏根據本身學習 sklearn 的經驗,我作一個總結的筆記。
這篇文章爲你們整理出 370 門精選的免費高質量編程計算機科學類的課程(涵蓋程序語言、人工智能、深度學習與機器學習等熱門話題)。這 370 門課程是從 Class Central 數據庫裏面的 7000 門課程挑選出來的,每一個課程的 Rating(評價)也是由該網站上獲取下來的平均值。
繼續棒!
若是想知道神經網絡原理和實現的,就趕忙戳開連接閱讀和查看吧
咱們知道,機器學習的特色就是:以計算機爲工具和平臺,以數據爲研究對象,以學習方法爲中心;是機率論、線性代數、數值計算、信息論、最優化理論和計算機科學等多個領域的交叉學科。因此本文就先介紹一下機器學習涉及到的一些最經常使用的的數學知識。
1、 加載 sklearn 中的數據集 datasets
from sklearn import datasets
iris = datasets.load_iris() # 鳶尾花卉數據
digits = datasets.load_digits() # 手寫數字 8x8 像素信息數據
1
2
3
4
1
2
3
4
查看數據的信息
print iris.data[:4] # 查看數據的特徵信息
print iris.data.shape # 查看數據的特徵信息維度
print iris.target_names # 查看標籤對應的文本
print iris.target[:4] # 查看數據的標籤 setosa:0 ...
做者的機器學習筆記整理。機器學習、深度學習、決策樹、決策樹應用已經 KNN,SVM 算法等等