微軟在企業中的統治地位是衆所周知的。微軟已經駕馭了雲計算浪潮。在第一財政季度,其 Azure 服務和 Office 365 在線生產力業務的收入分別增加了 90%和 42%。python
在微軟 CEO Satya Nadella 最近致全部微軟員工的一封信中,Intelligent Cloud 和 Intelligent Edge 組建了兩支新團隊,以塑造下一階段的創新。這意味着人工智能將要給微軟的業務帶來十分重大的改變。毋庸置疑,微軟在此公告以後可能會招聘更多 AI 相關員工。因此,如今你的機會來了。面試
像大多數僱傭工程師的其餘公司同樣,微軟有一套經典的面試過程。一般有電話面試(涉及編碼),而後進行現場面試。現場有大約 4-5 輪面試。面試過程當中可能有 2-3 個確實深刻研究數據科學相關的問題,包括研究和模型。其他的目的是測試編碼技能。算法
合併 k(在這種狀況下 k = 2)個數組並對它們進行排序。後端
如何最好地選擇 500 萬個搜索查詢的表明性樣本?數組
三個朋友告訴你今天會下雨,他們中每一個人都有三分之一的機率說謊,那麼今天下雨的可能性是多少?緩存
你能解釋樸素貝葉斯的基本原理嗎?如何設定閾值?服務器
你能解釋一下 MapReduce 是什麼以及它是如何工做的?微信
你能解釋 SVM 嗎?網絡
你如何檢測新的觀察結果是否異常?什麼是偏置 - 方差權衡?架構
如何從產品用戶羣中隨機選擇一個樣本?
你如何實現自動完成?
描述梯度提高的工做原理。
在整數列表中查找子序列的最大值。
你會如何總結 twitter 推文?
在應用機器學習算法以前解釋數據爭用(wrangling )和清洗的步驟。
如何處理不平衡的二進制分類?
如何測量數據點之間的距離?
定義方差。
箱形圖和直方圖有什麼區別?
你如何解決 L2 正則化迴歸問題?
如何經過使用一些計算技巧來更快地計算逆矩陣?
如何在沒有計算器的狀況下執行一系列計算。解釋步驟背後的邏輯。
好的和壞的數據可視化之間有什麼區別?
你如何找到百分位數?爲它編寫代碼。
從一系列值中查找最大總和子序列。
正則化指標 L1 和 L2 有哪些不一樣?
建立一個函數來檢查單詞是不是迴文。
亞馬遜從成爲「地球上最大的書店」變爲「地球上最以客戶爲中心的公司」。首席執行官傑夫·貝佐斯一次又一次地在他的致股東信中定義了公司的發展道路。亞馬遜利用 Alexa 部署深度語言學習功能,並經過 AWS 爲 AI 提供雲基礎架構。它還在 Amazon.com 上大規模地構建和部署了世界上第一批推薦系統。
在現場面試的過程當中,會有一場稱爲 Bar 面試。Bar raiser 的意思是,面試小組中最有經驗的人,他的動機是決定你是否在亞馬遜的前 50% 的員工中。Bar raiser 有權否決一個候選人,無論其餘面試者是否喜歡這個候選人。
邏輯迴歸模型中如何知道係數是什麼?
凸和非凸成本函數之間的區別 ; 當成本函數是非凸的時候它是什麼意思?
隨機權重分配是否優於爲隱藏層中的單位分配相同的權重?
給出一個條形圖而且想象你正從上面倒水,如何肯定條形圖中能夠保存多少水?
什麼是過擬合?
主要會員費的變化如何影響市場?
爲何梯度檢查很重要?
描述樹,SVM,隨機森林和 XGBoost 算法。談談他們的優勢和缺點。
你如何在天平上重複稱重 9 個彈珠三次以選擇最重的彈珠?
查找西雅圖客戶過去 6 個月中前 10 名利潤最高的產品的累計總和。
描述特定模型選擇的標準。降維爲何重要?
邏輯迴歸和線性迴歸的假設是什麼?
若是你能夠構建完美(100%準確度)的分類模型來預測某些客戶行爲,那麼
應用程序中會出現什麼問題?
項目位置 A 的項目機率爲 0.6,項目位置 B 的機率爲 0.8。在亞馬遜網站上找到項目的機率是多少?
給定帶有 ID 和數量列的「csv」文件,5000 萬條記錄和數據大小爲 2 GB,請用
您選擇的任何語言編寫一個程序來聚合 QUANTITY 列。
使用數組實現循環隊列。
若是您每個月都有時間序列數據,那麼它有大量的數據記錄,您將如何發現本月與前幾個月的數值存在顯着差別?
比較套索和嶺迴歸。
MLE 和 MAP 推斷有什麼區別?
給定一個帶有輸入的函數:一個 N 個隨機排序數的數組,以及一個 int K,返回一個 K 個數最大的數組。
當用戶瀏覽亞馬遜網站時,他們正在執行幾項操做。若是他們的下一個行動是購買行爲,創建模型的最佳方式是什麼?
鑑於全國範圍內可能性很低,估計一個城市的疾病機率。在這個城市隨機詢問 1000 人,所有爲負面反應(無疾病)。這個城市發病的機率是多少?
描述 SVM。
K-means 如何工做?你會選擇什麼樣的距離度量?若是不一樣的特徵有不一樣的動態範圍呢?
什麼是提高 (Boosting) 算法?
Facebook 不須要過多介紹。通過近十年來累積大量數據以後,2013 年起,Facebook 內的工程師開始嘗試使用 CNN。以後,Facebook 認識到 AI 和 Deep Learning 的重要性,並聘用了他們的第一位 AI 工程師——Google 大腦 Marc'Aurelio Ranzato。隨後又聘請了 CNN 的發明人 Yann LeCun(現已再也不負責 Facebook AI 研究院的領導工做)。
Facebook 面試過程是大多數公司使用的標準面試過程。可參考:
https://www.facebook.com/notes/facebook-engineering/get-that-job-at-facebook/10150964382448920/
有一個 100 層的建築物,2 個相同的雞蛋。您如何使用 2 個雞蛋來查找閾值樓層 N,在 N 層及 N 層以上,雞蛋確定會摔碎。
從 100 個硬幣中隨機抽取一枚硬幣:1 枚不公平的硬幣(都是正面),99 枚公平的硬幣(一正一反)並投擲 10 次。若是結果是 10 個正面,那麼這枚硬幣是不公平的機率爲多少?
在 Python 中爲數值數據集編寫排序算法。
Facebook 想要開發一種方法來估計人們生日的月份和日期,而無論人們是否直接給咱們提供這些信息。你會提出什麼方法和數據來幫助完成這項任務?使用 python 內置包來處理'csv'數據。
您如何比較兩種不一樣後端引擎的自動生成 Facebook「朋友」建議的相對錶現?給定 KPI,選擇正確的指標,執行 ETL。(使用 SQL / 代碼)
你即將坐飛機去西雅圖。你想知道你是否應該帶一把雨傘。你能夠給 3 個隨機的朋友打電話,每一個人都會獨立詢問是否下雨。你的每一個朋友都有三分之二的機會告訴你真相,並有三分之一的機會經過撒謊與你打交道。全部 3 位朋友都告訴你正在下雨。在西雅圖實際下雨的可能性有多大?(同微軟的那道題)
考慮一個有 2 名玩家 A 和 B 的比賽。A 有 8 個棋子,B 有 6 個棋子。比賽進行以下。首先,A 滾動一個公平的六面模具,而且模具上的數字決定 A 從 B 接收多少個寶石。接下來,B 滾動相同的模具,而且徹底相同的事情發生在相反的位置。本輪結束。誰在比賽結束時擁有更多的寶石則贏得比賽。若是玩家在回合結束時得到相同數量的寶石,則會造成平局而且接下來會有一輪。B 在 1,2,...,n 輪獲勝的機率是多少?
你如何獲得一個句子中每一個字母的數量?
經過了解性別或身高,你如何證實男性平均身高比女性高?
什麼是猴子補丁(monkey patch)?
給定一個對象列表 A 和另外一個與 A 相同的列表 B,一個元素被刪除,請找到被刪除的元素。
給定一個整數列表(正數和負數),編寫一個算法來查找是否至少有一對總和爲零的整數。你會如何提升算法的性能?
製做 2 個變量的直方圖。
在 SQL 中構建回帖計數的直方圖(包含 x 個回覆,x + 1 個回覆等的帖子數)。創建一個表格,其中包含每一個用戶天天使用的功能使用狀況摘要(跟蹤用戶的最後一個操做並天天彙總)。
你在一個賭場擲色子,若是擲出 5 則贏,並得到 10 美圓的獎金。你能賺多少?若是你一直玩到你贏了 (無論花多長時間),那麼你的預期支出是多少?
若是您試圖讓客戶註冊 Facebook 廣告,您會向小型企業展現什麼指標?
給定發送好友請求和收到好友請求的表格,找到擁有最多好友的用戶。在平臺上花費的贊 / 用戶和分鐘數正在增長,但用戶總數正在減小。最有可能的根本緣由是什麼?
多少人在他們的檔案中列出的高中是真實的?咱們如何發現並大規模部署尋找無效學校的方法?
你如何將暱稱(Pete,Andy,Nick,Rob 等)映射到真實姓名?
Facebook 認爲讚的年同比增加 10%,爲何會這樣呢?
若是一位管理人員表示他們但願將新聞源廣告的數量加倍,那麼如何肯定這是否是一個好主意?
谷歌擁有一些世界上最有才華的人工智能研究科學家、數據工程師和數據科學家。Google 首席執行官 Sundar Pichai 專一於將 Google 從新整合爲一家人工智能第一公司。谷歌已經將其全部或大部分產品的人工智能編碼從 Gmail 遷移到擁有大量數據的自動駕駛系統。
Google 的技術面試流程是標準的技術面試流程。它由電話視頻面試和現場面試組成。詳情參見:
https://careers.google.com/how-we-hire/interview/#interviews-for-software-engineering-and-technical-roles
什麼是 1 / x 的導數?
繪製曲線 log(x + 10)
如何設計客戶滿意度調查?
擲硬幣十次,獲得結果爲 8 個正面和 2 個反面。如何分析一枚硬幣是否公平?p 值是什麼?
你有 10 個硬幣。你每擲硬幣 10 次(共 100 次)並觀察結果。你會修改你的方法來測試硬幣的公平性嗎?
解釋一個不是正態的機率分佈以及如何應用它?
爲何使用特徵選擇?若是兩個預測因子高度相關,那麼對邏輯迴歸中的係數有什麼影響?係數的置信區間是多少?
K- 均值和高斯混合模型:K 均值和 EM 之間有什麼區別?
當使用高斯混合模型時,你怎麼知道它適用?(正態分佈)
若是標籤在聚類項目中是已知的,那麼如何評估模型的性能?
有一個谷歌應用程序,作了一個改變。如何測試指標是否增長?
描述數據分析的過程?
爲何不進行邏輯迴歸,爲何選擇 GBM?
推導 GMM 方程。
如何衡量有多少用戶喜歡視頻?
模擬雙變量法線
導出分佈的方差
每一年有多少人申請 Google?
如何創建中位數的估計量?
若是迴歸模型中的兩個係數估計值中的每個都具備統計顯着性,那麼您是否指望二者的測試仍然很重要?
Uber 的技術面試流程是一個標準的技術面試流程,由電話視頻面試和現場面試組成(一般是 5-6 輪面試)。Uber 在其工程博客上詳細解釋了這一點:
https://eng.uber.com/engineering-interview/
描述二值分類
計算 ROC 曲線的 AUC
如何使用 A / B 測試?
使用隨機伯努利試驗發生器編寫函數以返回來自正態分佈的值樣本
P 值是什麼意思?
解釋線性迴歸、線性假設和線性方程
定義 CLT,它和 Uber 有何關係?
解釋 Logistic 迴歸、Logistic 假設和 Logistic 方程
一個車隊要花多少錢才能看到咱們每一個大城市的街景照片?
如何創建汽車租賃司機成本的模型?
解釋 surge 訂價算法是如何工做的,以及如何測試哪一種策略更有效?
什麼是交叉驗證?
網絡效應如何影響選擇來定義實驗和測量結果?
什麼是異常檢測方法?
駕駛情況和擁堵對 Uber 收入有何影響?
駕駛情況和擁堵如何影響 Uber 的收入或司機體驗?
高速緩存如何工做以及如何在數據科學中使用它?
如何優化各類營銷渠道之間的營銷支出?
如何計算一個城市 Uber Pool 的半徑?
如何決定一個地點是否應該包含在 Uber Pool 中?
什麼是時間序列預測技術?
解釋 PCA,PCA 假設,PCA 方程式。
Uber 會形成交通堵塞嗎?
AI 被包含在蘋果硬件之上的軟件中。也就是說,人工智能是蘋果的一種服務。根據他們在 2018 年一季度的收益報告,他們的服務收入比去年增加了 18%。截至去年 12 月底,全部服務產品的付費用戶數量都超過了 2.4 億。
與大多數僱傭工程師的其餘公司同樣,蘋果公司也有典型的面試流程,電話面試與現場面試兼有。現場大約有 4-5 名團隊成員進行面試。詳情可參考:
https://www.quora.com/What-is-the-recruiting-and-hiring-process-of-Apple-How-does-one-contact-their-HR-department
如何以數百萬的交易數量吸引數百萬用戶,並將這些用戶集中在一個有意義的細分市場中?
咱們對數據進行預先篩選以消除欺詐威脅 - 那麼咱們如何找到可用於肯定欺詐事件真實表示的數據樣本?
給定一張帶有用戶 ID 和用戶購買的產品 ID 的 1B 的表格,以及具備用產品名稱映射的產品 ID 的另外一張表格。咱們試圖找到常常由同一用戶一塊兒購買的配對產品,例如葡萄酒和開瓶器,薯片和啤酒。如何找到這些並存的成對產品中的前 100 名?
請詳細描述 L1 和 L2 正規化之間的區別,特別是對於它們對模型培訓過程自己的影響的差別。
假設你有 100,000 個文件分佈在多個服務器上,如何在 Hadoop 中處理這些文件?
Python 和 Scala 有什麼區別?
解釋 LRU 緩存。
如何設計一個客戶端 - 服務器模型,客戶端每分鐘發送一次位置數據?如何將數據從一個 Hadoop 集羣傳輸到另外一個 Hadoop 集羣?
Java 中有哪些不一樣類型的 memory?
如何處理數百個標題的元數據同時進行的平常繁瑣任務?
在數據流和可訪問性方面,如何衡量在隱藏時間框架內的成功,在這個時間框架中,核心超載了將計算機能量重定向到地窖圓頂的過分複雜文件系統的邊界結構?
你最想擁有的超能力是什麼?
你有時間系列的傳感器,預測下一個讀數。
使用 SQL 建立超市購物籃輸出。
你有什麼心理實踐經驗?(基於研究組合的問題)
您在表徵方面的專長是什麼?一般使用什麼?你如何在研究中使用它並找到有趣的結果?(Research Portfolio based question)
你如何處理失效分析?
檢查一個二叉樹是不是左右子樹上的鏡像。
什麼是隨機森林?爲何樸素貝葉斯更好?
六家表明着頂尖科技的技術企業,六套面試題,你們能夠在這幾套題中看到每家公司的側重點有何不一樣,建議先收藏再慢慢研究。若是你可以爲上面的面試題給出解答,歡迎留言聯繫咱們,咱們將很樂意把你的解答發佈出來給其餘讀者參考,你們共同進步!若是你在面試中遇到了其餘問題,也請留言或加入咱們的社羣,相信 AI 前線社羣萬能的大牛們會爲你解答!
若是你能把上面這幾套面試題研究透徹,就算進不了這六家公司,相信國內的 AI 大廠一樣會爲你敞開大門,將來就在你的手中!
參考連接
https://medium.com/acing-ai/microsoft-ai-interview-questions-acing-the-ai-interview-be6972f790ea
https://medium.com/acing-ai/amazon-ai-interview-questions-acing-the-ai-interview-3ed4e671920f
https://medium.com/acing-ai/facebook-ai-interview-questions-acing-the-ai-interview-5982add0af55
https://medium.com/acing-ai/google-ai-interview-questions-acing-the-ai-interview-1791ad7dc3ae
https://medium.com/acing-ai/uber-ai-interview-questions-acing-the-ai-interview-9532794bc057
https://medium.com/acing-ai/apple-ai-interview-questions-acing-the-ai-interview-803a65b0e795