1. 算法相關
1.1 《編程珠璣》
1.2 《編程之美》
這兩本是最經典的了,這裏面注重的是解決問題的思路,看的時候裏面的問題要認真思考再參考解答。下面兩本是對具體的面試題作一些解答,同時有詳細代碼實現的。
1.3 《劍指Offer》
1.4 《Cracking the coding interview》
上面這四本我以爲都是必備的,裏面的題目解決思路要數量掌握,可以觸類旁通、解決相關變種問題。同時,裏面的題目,應該都要在紙上實現,而後再在電腦裏實現、測試。Bug-free是面試中重點考察,面試官也會常常讓面試者寫測試用例,因此,平時咱們要養成這些好的習慣。
2. 機器學習必備算法
【算法和理論基礎精通級別】:
2.1.1 各類聚類方法(K-Means, 如何用hadoop實現K-Means)
2.1.2 logistic (naive bayes和logistic regression的區別)
2.1.3 KNN
2.1.4 決策樹
2.1.5 SVM (SVM裏面的核)
2.1.6 LDA(LDA的原理和推導)
2.1.7 DeepLearning (AutoEncoder和RBM)
2.1.8 HMM和CRF
2.1.9 AdaBoosthtml
何爲精通?可以隨手寫出這些算法的核心遞歸步的僞代碼以及他們優化的函數表達式和對偶問題形式。 數學知識方面,應當深入理解矩陣的各類變換,尤爲是特徵值相關的知識。算法方面:應當深入理解經常使用的優化方法:梯度降低、牛頓法、各類隨機搜索算法(基 因、蟻羣等等),深入理解的意思是要知道梯度降低是用平面來逼近局部,牛頓法是用曲面逼近局部等等。面試
【工程實現級別】:
應當深入理解在理論基礎中列出的各類算法對應應該採用的數據結構和對應的搜索方法。好比KNN對應的KD樹、如何給圖結構設計數據結構?如何將算法map-red化等等。通常來講要麼會寫C,並且會用MPI,要麼懂Hadoop,工程上基本都是在這兩個平臺實現。
MPI, Hadoop, MapReduce, Spark算法
【業務理解和思考深度】:
機器學習大多數場景是搜索、廣告、垃圾過濾、安全、推薦系統等等。對業務有深入的理解對你作出來的系統的結果影響超過70%。
作廣告點擊率預測,用哪些數據什麼算法
推薦系統的算法中最近鄰和矩陣分解各自適用場景
用戶流失率預測怎麼作(遊戲公司的數據挖掘都喜歡問這個)
一個遊戲的設計過程當中該收集什麼數據
如何從登錄日誌中挖掘儘量多的信息編程
參考2.1 常見面試之機器學習算法思想簡單梳理
參考2.2 如何準備機器學習工程師的面試
參考2.3 【筆記分享】機器學習筆記安全
3. 在線編程
3.1.LeetCode http://leetcode.com/
這個網站裏有不少經典面試題的講解,固然最主要的是它的OJ系統,裏面有100多道題目,和ACM OJ不一樣的是,這裏面的題目都是來自於面試題,全部更有針對性,建議至少刷3遍,我刷了差很少5,6遍,多刷幾遍不丟人。
3.2.POJ http://poj.org/
這是北大的OJ,leetcode知足不了你,就能夠來這刷了,若是還知足不了就找國外的OJ吧,USACO、URAL等。
外企(Google、MS、Yahoo等)> 國內互聯網(阿里、騰訊、百度、網易等)> 企事業單位
3.4. Python http://checkio.org/ 遊戲模式的在線編程。IDE,PYCHARM
4. Careercup http://www.careercup.com/
國外著名的幫助找工做的網站,裏面有不少Google,MS,FB,Amazon等等名企的面試題,有精力就一道一道作吧。完成Careercup裏Amazon、Google和Microsoft這三個分類下面的前20頁面試題數據結構
集齊了大量的真實筆試面試題,去外企的必定得看
【參考】
1. 2014年計算機求職總結–準備篇
2. 9個offer,12家公司,35場面試,從微軟到谷歌,應屆計算機畢業生的2012求職之路
3. 個人求職路:華爲、中興、百度、騰訊dom
from: http://jacoxu.com/?p=1139機器學習