機器學習

學習路徑
數學: 線性代數:矩陣的意義和計算(四則運算,矩陣的逆,轉置矩陣),向量;
高數:微積分,求導(包括偏導),泰勒定理,麥克勞林公式,拉格朗日乘數法,方向導數與梯度算法,最小二乘法
機率與統計:分佈函數(正態分佈,伯努利分佈,多項式分佈,指數分佈—時間間隔,泊松分佈—時間段內事件發生),機率密度函數,機率質量函數,貝葉斯定理,條件機率,最大似然值,異常值檢查(如z分數),數學指望,方差,標準差,相關係數
數值計算:牛頓法
信息論:信息熵的技術
機器學習算法:
線性迴歸,邏輯迴歸,局部加權線性迴歸,隨機森林,貝葉斯分類器,gbdt,決策樹,k-mean
編程語言:
Python,r,matlab
程序包:
Scikit-learn,Deeplearning4j,DataVec
基礎框架:
Tensorflow,caffe,keras

參考資料
數學:線性代數及其應用(lay,strang),同濟;高數(同濟);統計(浙大);數學分析(Rudin著)
https://www.coursera.org/learn/machine-learning;NG
斯坦福深度學習自燃語言,http://cs224d.stanford.edu/syllabus.html,深度學習:好比遞歸、分類、聚類和預測
http://blog.csdn.net/zouxy09/article/details/48903179
http://www.cnblogs.com/DjangoBlog/p/6201663.html
以上是gbdt的python,使用scikit庫,不錯的例子
學習資料:http://blog.jobbole.com/56256/
http://www.infoq.com/cn/articles/deep-learning-time-series-anomaly-detection
Scikit-Learn庫已經實現了全部基本機器學習的算法
http://www.csdn.net/article/2015-09-16/2825716
書籍:Introduction to Machine Learning with Python;機器學習實戰;機器學習
(周志華教授)

相關博客 http://www.cnblogs.com/denny402/

應用場景
廣告點擊率預測
營銷效果預測
信用風險識別
故障預測
智能投顧
業務指標預測

機器學習

機器學習是人工智能的一個分支。人工智能的研究是從以「推理」爲重點到以「知識」爲重點,再到以「學習」爲重點,一條天然、清晰的脈絡。顯然,機器學習是實現人工智能的一個途徑,即以機器學習爲手段解決人工智能中的問題。機器學習在近30多年已發展爲一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。機器學習理論主要是設計和分析一些讓計算機能夠自動「學習」的算法。機器學習算法是一類從數據中自動分析得到規律,並利用規律對未知數據進行預測的算法。由於學習算法中涉及了大量的統計學理論,機器學習與推斷統計學聯繫尤其密切,也被稱爲統計學習理論。算法設計方面,機器學習理論關注能夠實現的,行之有效的學習算法。不少推論問題屬於無程序可循難度,因此部分的機器學習研究是開發容易處理的近似算法。
機器學習已普遍應用於數據挖掘、計算機視覺、天然語言處理、生物特徵識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略遊戲和機器人等領域。

目錄
    1 定義
機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能。
機器學習是對能經過經驗自動改進的計算機算法的研究。
機器學習是用數據或以往的經驗,以此優化計算機程序的性能標準。
    2 分類
監督學習從給定的訓練數據集中學習出一個函數,當新的數據到來時,能夠根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出,也能夠說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習算法包括迴歸分析和統計分類。
無監督學習與監督學習相比,訓練集沒有人爲標註的結果。常見的無監督學習算法有聚類。
半監督學習介於監督學習與無監督學習之間。
加強學習經過觀察來學習作成如何的動做。每一個動做都會對環境有所影響,學習對象根據觀察到的周圍環境的反饋來作出判斷。
    3 算法
    構造間隔理論分佈:聚類分析和模式識別
        人工神經網絡
        決策樹
        感知器
        支持向量機
        集成學習AdaBoost
        降維與度量學習
        聚類
        貝葉斯分類器
    構造條件機率:迴歸分析和統計分類
        高斯過程迴歸
        線性判別分析
        最近鄰居法
        徑向基函數核
    經過再生模型構造機率密度函數:
        最大指望算法
        機率圖模型:包括貝葉斯網和Markov隨機場
        Generative Topographic Mapping
    近似推斷技術:
        馬爾可夫鏈
        蒙特卡羅方法
        變分法
    最優化:大多數以上方法,直接或者間接使用最優化算法。

培樂園課程

機器學習初級班
經過這個課程你能夠對機器學習的領域中最爲基礎和普遍的幾類算法有所瞭解,並可以獨立實現相關算法,以及在實際工做中較熟練的進行相關知識的運用。同時能夠令本來沒有相關背景的人員創建一個較爲完整機器學習的知識體系,爲各種推薦,天然語言處理,互聯網廣告,視覺處理等應用領域的學習和工做提供必要的基礎。

課程目錄
章1機器學習基礎和分類
1機器學習基礎
2貝葉斯分類及應用
3K最近鄰分類
4實訓:訓練樸素貝葉斯分類器進行文檔分類

章2感知機和SVM
1線性感知機分類
2支持向量機
3理論性質和工具
4實訓:SVM工具包使用

章3聚類
1聚類基礎知識
2凝聚層次聚類
3K-means聚類
4基於GMM的聚類
5實訓:利用K-means算法完成新聞聚類

章4迴歸
1線性迴歸
2邏輯迴歸
3正則化框架
4搜索廣告算法
5實訓:廣告點擊率預估

章5關聯規則
1關聯規則挖掘介紹
2Apriori算法
3FP-Growth算法
4協同過濾基礎
5實訓:電影演員關聯規則挖掘

章6圖模型與中文分詞
1中文分詞技術概述
2馬爾科夫模型與語言模型
3隱馬爾科夫模型及應用
4實訓:訓練HMM切詞器,對任意輸入字符串進行解碼

機器學習高級班
經過這個課程你能夠對機器學習算法或模型的原理及如何優化調整有更深入的理解,而後在此基礎上,創新地運用該技術解決更復雜的問題。特別針對專職進行算法研發方面的人員,以及有志於成爲更高層次機器學習、數據挖掘方面人才的人員。

課程目錄
章1主題模型
1機率圖模型基礎
2EM算法
3PLSA模型
4LDA模型
5實訓:基於EM算法的PLSA訓練程序並對新聞進行分類
6實訓:基於Gibbs採樣的LDA訓練程序並對新聞進行分類

章2條件隨機場與最大熵模型
1最大熵模型
2隱馬模型
3條件隨機場
4實訓:基於尺度迭代法的最大熵模型的訓練程序實現並用其進行新聞分類

章3SMO和CD算法
1SVM對偶問題
2SMO算法
3CD算法
4實訓:編寫基於SVM的單變量優化算法

章4L-BFGS迭代優化和OWLQN
1擬牛頓法
2L-BFGS算法
3OWLQN算法
4實訓:基於LR迴歸問題,編寫對應LBFGS算法

章5神經網絡和深度學習
1神經網絡
2什麼是深度學習
3深層網絡的基本構成單元
4深層網絡的學習方法和應用成果
5實訓1:基於MNIST數據集,寫一個簡單的單隱層神經網絡分類算法;寫一個自編碼器學習MNIST特徵
6實訓2:用caffe進行imageNet分類和MNIST訓練
7實訓3:學習Theano基本操做,並用Theano寫一個LSTM用於生成小說

章6決策樹和模型融合
1決策樹簡介
2模型集成
3Bagging集成
4Boosting算法
5Tree-based&混合模型
6實訓:使用Adaboost算法分類html

相關資料網址python

http://blog.csdn.net/jianjian1992/article/details/48688311android

http://blog.csdn.net/a819825294?viewmode=contentsgit

 

 

這樣也能夠出書?程序員

 

https://www.zhihu.com/question/28544155/answer/125304347面試

 

博客 http://blog.greatgeekgrace.com/算法

 

https://www.zhihu.com/question/61732584數據庫

 

09年本科畢業,開發工做將近9年,最開始作過單片機,嵌入式Linux,後續作Android驅動以及系統開發,如今在阿里作Android開發工做。說實話,在阿里見識到了不少優秀的人,也讓我有了不少思考。我的的開發經歷(嵌入式Linux、android底層、Android APP開發)也算比較豐富了,總結一下這些經歷,隨着時間的推動,這些開發的門檻愈來愈低,最開始作單片機,每一個寄存器都須要本身看看完之後才能搞功能,如今的單片機芯片,基本廠家都會提供一系列的驅動代碼移植好的操做系統等,你只要關心本身的應用,隨着時間的推移,如今有愈來愈多的應用代碼框架開源出來,那麼應用的門檻也會下降;Android系統的開發,提及來算是比較難的,可是須要的人有多少?無非國內幾個手機廠商,並且隨着google越抓越緊,系統開發工做也會愈來愈簡單,APP開發就更明顯門檻很低,並且之後會愈來愈低,作上多年之後發現你的技術,新人幾個月就學會了,你跟新人差異不在技術上,而是在踩的坑多了,對問題思考比較深刻。總的來說這也是一個正常的趨勢,一個行業最開始不成熟,須要大量優秀的人去作基礎設施,基礎設施越作越好,該行業就愈來愈簡單,如今歐美等發達國家,少兒編程很是火熱,也就是說咱們如今的編程技能,之後會成爲一個基礎技能,就像如今你們都會用office同樣。
那麼問題來了,做爲一個開發人員,知道這些趨勢,該如何作職業規劃,我如今的想法是去作算法,對於算法我我的的認爲是,它是一個鏈接現實世界和計算機世界的橋樑,現實世界發現一個問題,那麼咱們怎麼經過計算機來解決這個問題,與普通開發不一樣的是,普通開發是現有成熟技術的應用,而算法則須要本身去摸索而且實驗找到一種方法來解決問題,往高了作,能夠當作研究發paper,往低了作,能夠作工具化下降高端技術應用門檻,是一個比較好的規劃方向,也不知道個人想法對不對?
如今機器學習技術很是火熱,整體來說,往上它還有不少技術點沒有攻破,好比訓練所需資源太多,並不能像人同樣思考等等,往下它已經開始工具化而且應用了,好比TensorFlow等各類開源框架,在語音識別,圖像識別領域的應用等等。這個行業,能夠說是正在基礎建設的階段,而不是像普通開發同樣,已經成熟,而且在下降門檻的階段,在未來的一段時間內,機器學習只要往高了走,仍是相對門檻比較高的行業,可是不保證10年20年之後,人工智能已經很是強大,能夠本身進化,不須要咱們作研究了。既然想進入這個行業,那麼問題來了,做爲一個這麼長時間開發經驗的人來說,年齡在這,開發功底在這,沒有算法相關經驗,怎麼能進入這個行業呢?私下裏我自學了一些機器學習方面的知識了:

自學
 自學andrew ng coursera上的機器學習課程,並完成全部做業。
 完成google 在Udacity上的深度學習課程,並完成全部做業。
 完成tensorflow官網的基礎培訓,包含tensorflow API以及tensorboard使用
 正在研讀google出品的《深度學習》電子書,加深對深度學習的理解。

能力
 1.熟悉經常使用的機器學習算法:線性迴歸,邏輯迴歸,神經網絡,SVM,KNN,K-means
 2.熟悉常見的降維方法:PCA,T-SNE
 3.熟悉常見的深度學習模型。CNN,RNN,LSTM
 4.熟悉基於內容的推薦系統,協同過濾算法。
 5.熟悉深度學習常見正則化方法:L1,L2
 6.熟悉tensorflow和tensorboard的用法。
 7.熟悉常見的圖像處理模型(CNN+pool+dropout)以及天然語言處理常見模型(word2vec,語言生成模型)
 8.良好的Python基礎,很強的編程能力
實踐
 photoOCR 準確率:0.301
按照andrew ng課程裏面講解的方法實現,包含文字定位,文字分割和文字識別三部分,利用SVM做爲分類器,使用MSCOCO數據庫和本身建立數據庫,能夠作到定位並識別英文字母30.1%
 kaggle Digit Recognizer 競賽成績:0.99400 排名167/1696
使用tensorflow爲深度學習框架,模型爲:2層卷積+2層pool+2層全鏈接+dropout+L2正則化+softmax分類,最終得到0.99400 的準確率

 基於手機的AR(運動狀態檢測)算法 準確率:靜止和步行90%+ 騎行和乘車:80%+
經過手機攜帶的加速度,陀螺儀,磁力計等傳感器,來判斷用戶當前的運動狀態(支持4種狀態),研讀論文提取傳感器數據特徵(均值 方差 傅里葉變換 信息熵等等),而後作數據特徵篩選,訓練不一樣分類器的(KNN,SVM,隨機森林等),作效果對比,最終選擇出最佳的數據特徵和分類器

可是!可是!可是!我並無不少的實踐經驗,找工做時,不少公司都要有經驗的,投了一些簡歷,有很HR聊過天,卻沒有一個面試通知,在這個艱難的階段,怎麼去作才能順利的轉行??我該找一份什麼樣的工做?你們有什麼好的思路??
編程

 

 

 

https://www.zhihu.com/question/47345129網絡

 

做者:find goo
連接:https://www.zhihu.com/question/47345129/answer/132120680
來源:知乎
著做權歸做者全部。商業轉載請聯繫做者得到受權,非商業轉載請註明出處。

古代有苗族人養蠱,現代有人工智能算法競爭法。

給個沒法窮舉的最優化問題,把下面的算法寫好後相互pk,獲得最後是最優的。

無論俗不俗,鬥蟋蟀是一種樂趣,鬥算法也是一種交流方式。高校好這口子,公司也愛開會交流,國家也但願創新,我的想搭順風車。

天下熙熙,皆爲利來,天下壤壤,皆爲利往。

智能算法是個框,想裝什麼有什麼,什麼數學,哲學,生物,藝術,硬件,量化交易,工程,管理,產品,大數據,數據挖掘,在線分析,均可以往這個框子裏裝。


這些算法裏面又有不少分支,光一個神經網絡資料都是汗牛充棟,一個遺傳算法論文更是普天蓋地,更不要說被谷歌阿法狗引爆的深度學習了。

你可知道數學中一個無窮大,能夠爭論幾個世紀。學過排列組合的都知道,在原料不少時會形成組合指數爆炸,幾十種算法,加百種數學模型,並且新的算法模型不斷涌現,夠高校科研幾百年的原料了,寫滿個圖書館沒問題。

古來聖賢皆寂寞 唯有算法留其名

純數學經歷幾百年的發展,理論體系都比較成熟穩定,純理論創新比較難,這些理論比較抽象很難運用到現實當中,在有了計算機算法後,數學家發現算法是數學的伊甸園,發展空間很大,實際用處也大,所各類算法只會層出不窮,由於研究數學的聖賢太寂寞了。

不少軟件或硬件產品,還只是採集信息做用,讓人來決策,市面上真正作到半人工智能程度的產品都是百裏挑一,多數是大公司的雲計算包裝過的智能算法,科技成果轉化率特別低,由於要懂這些算法和原理,又要懂產品編程的人很是少。

隨着程序員的技術素質和工做年限的不斷提升,不知足於原有if-else,crud的碼農模式,不少開始學習人工智能算法轉型,增強產品核心競爭力,市場須要比較大。

gov軍事爲了應用無人機,各種飛行器,同美國競爭,必然有智能算法技術實力增強武器的不足,經濟上爲了提升國際上產品競爭力進而收稅,因此對大數據,工業化和信息化交叉,各種軟件,電子產品都但願有智能算法支撐。不要忘了螳螂捕蟬黃雀在後的稅費。

多方做用結果,人工智能算法熱是必然的,人工智能+雲計算+大數據+移動互聯網,這幾項技術是將來很長一段時間發展趨勢。

k近鄰算法

支持向量機

PCA算法

決策樹

隨機森林

葉貝斯算法

模糊數學算法

近似度分類

遺傳算法

人工魚羣算法

蛙跳算法

蝙蝠算法

螢火蟲算法

布穀鳥搜索算法

禁忌搜索算法

蟻羣算法

量子模擬退火算法

粒子羣算法

雜草算法

細菌覓食算法

人工神經網絡

人工蜂羣算法

深度學習
 
http://www.thuir.org/group/~mzhang/
 

機器學習目標

 

崗位分析

滴滴出行效能平臺招聘
資深機器學習/深度學習工程師

20k-40k /杭州 / 經驗3-5年 / 本科及以上 / 全職

職位誘惑:
帶薪休假,豐厚年終獎,彈性工做
   
職位描述:

工做職責:
1. 負責團隊AI算法模型設計和實施,負責機器學習/深度學習項目落地應用,包括算法原理、模型設計、模型訓練、算法應用等內容;
2. 應用深度學習模型對文本進行模型訓練、建模開發,對候選人才進行智能解析、智能評估、匹配推薦,使用人工智能的方式來提高招聘效率;
3. 規劃大數據人才庫方向和應用,提高AI智能招聘的效率和準確率,提高AI智能招聘行業的影響力;
4. 項目須要大量用到NLP相關技術、數據挖掘、深度學習等相關技術,能帶領團隊快速落地算法模型;

要求:
1. 具有深度學習相關背景,熟悉深度學習在NLP領域的應用,有相關工做背景;
2. 有一流互聯網公司深度學習/AI的相關工做背景,或者在該領域有較深的學術研究;
3. 具有機器學習/深度學習相關的工程能力,熟悉hadoop生態、scikit-learn、tensorflow、caffe等; 
4. 3年以上算法工做經驗,本科以上學歷;
    
工做地址
杭州 - 西湖區 - 西溪 - 杭州市西湖區紫霞街80號西溪谷商務中心G座8-10F

 

騰訊QQ音樂招聘機器學習算法工程師25k-35k /深圳 / 經驗3-5年 / 碩士及以上 / 全職 職位誘惑:優秀平臺職位描述:崗位描述:1. 負責大規模分佈式深度學習算法架構的設計,開發,及調優工做;2. 負責針對大規模結構化/非結構化數據,進行數據清洗,數據標註,特徵挖掘,模型建模,統計分析,造成可落地產品建議;3. 負責參與海量用戶行爲挖掘及建模,構建全維度用戶畫像系統,構建完備用戶生命週期管理體系;4. 負責機器學習尤爲是深度學習前沿問題的探索與研究,結合可能的實際應用場景提供完備的技術解決方案;5. 對音視頻處理、天然語言處理等領域提供算法模型支持。崗位要求:1. 名校機器學習、人工智能、數據挖掘、天然語言處理等領域的計算機科學或其它人工智能相關專業碩士及以上學歷;2. 紮實可靠的編程能力,精通C/C++/JAVA/Python至少一門編程語言;3. 有機器學習、人工智能、天然語言處理等領域領先企業的工做經驗者優先;4. 熟悉Hadoop、Hive、Spark等大規模數據處理技術;5. 熟練掌握Tensorflow/Caffe/Theano等一個或多個深度學習平臺的使用;6. 有責任心,溝通能力佳,抗壓能力強,表達能力出衆者優先。工做地址深圳 - 南山區 - 科技園 - 萬利達大廈

相關文章
相關標籤/搜索