百度數據挖掘筆試題

1、簡答題(本題共30分)linux

一、如何理解繼承、多態、組合,請舉例說明它們的應用。(10分)面試

二、請列舉出進程間通訊的幾種方式(至少列舉出三種)。(10分)算法

三、請寫出貝葉斯公式,請描述樸素貝葉斯分類方法的原理和步驟。(10分)編程

2、算法與程序設計(本題共40分)設計模式

一、兩個長度爲100的隨機向量X和Y,X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),其中xi和yi都是從均值爲0,標準差爲1的正態分佈中隨機選擇的數,隨機變量Z爲X何Y的相關係數,請問:數組

1)Z的指望和標準差是多少,請寫出簡單的推導公式?(10分)函數

2)請用蒙特卡洛方法模擬,寫代碼計算Z的指望和標準差。(10分)優化

二、假設張三的mp3裏有1000首歌,如今但願設計一種隨機算法來隨機播放。與普通隨機模式不一樣的是,張三但願每首歌被隨機到的改了吧是與一首歌的豆瓣評分(0~10分)成正比的,如朴樹的《平凡之路》評分爲8.9分,逃跑計劃的《夜空中最亮的星》評分爲9.5分,則但願聽《平凡之路》的機率與《夜空中最亮的星》的機率比爲89:95,。如今咱們已知這1000首歌的豆瓣評分:ui

(1)請設計一種隨機算法來知足張三的需求。(10分)設計

(2)請寫代碼實現本身的算法。(10分)

3、系統設計題(本題共30分)

一、咱們隊一批一維數據進行迴歸擬合。給你訓練數據D=(xi,yi),i=1…n,其中xi∈R是一個實數,yi∈R是xi對應的迴歸座標。咱們擬使用線性,二次,高次函數對yi進行擬合:

線性函數:f(x)=ax+b

二次函數:f(x)=ax2+bx+c

三次函數:f(x)=ax3+bx2+cx+d

①咱們設定最小均方偏差爲損失函數,請寫出損失函數的具體形式。(5分)

②以二次函數你和爲例,請使用隨機梯度降低(stochastic gradient decent)對損失函數進行優化,給出參數a,b,c的梯度推倒並寫出算法。(7分)

③下面三圖分別是一次函數,二次函數,七次函數擬合的結果,同時給出它們在D上的損失函數值一次是0.76,0.15,0.01。在選擇用什麼函數做爲最終擬合函數的時候,你會有哪些考慮。本例中你學會選擇哪一個(8分)

baiduint001

 

 

OooO面試的是美團的算法工程師,面試地點:

一面是技術面

一、 自我介紹

二、 簡歷上項目的簡要介紹

三、 算法題:數組先遞增後遞減,要求找到最大值。要求寫出代碼

四、 會不會JAVA、linux,Unix編程、設計模式?

五、 C++多態實現並舉例(寫代碼)

六、 Static變量的做用,堆棧的區別

七、 機率題:2個容器,第一個容器4個紅球和5個白球,第二個容器3個紅球和8個白球,隨機取出一個球,已知是紅球那麼它是來自於第一個容器的機率是多少?

OooO說第四個題目一串知識,他全實事求是的答的不瞭解或者不會,可是仍是經過了第一輪面試。

二面仍舊是技術面

一、 跟項目相關的算法題

二、 有兩個數組X1[n],X2[n]。X1是已知的,X2須要計算。定義常數r,X2[i] = X1[i]的前r個元素和後r個元素共2r+1個元素的均值;對於前r個和後r個,因爲缺乏數據,就有多少個算多少個的均值。先講思想,再寫代碼。

三、 已知數組如X=[1,2,3,4],輸出其全部子集,如1,2,3,4,12,23,34,123,234,1234…(筆試時未完成的題目)。

四、 智力邏輯題:3*3的九宮格,填寫1—9,使得全部行、列、對角線的和都是相等的,那麼中間那個方格數字是什麼?要求給出理論證實。

三面是HR面

一、智力題::7*7的方格,總左下角走到右上角,最短路徑前提下一共有多少種不一樣路徑

二、HR相關非技術題目

相關文章
相關標籤/搜索