在網上找的新浪的數據分析的筆試題mysql
2012新浪校園招聘數據分析師職位筆試題目。A卷(統計方向)60分鐘
填空題。linux
一、KMO值在( )範圍內,因子分析纔是有效的。
解答:kmo檢驗統計量是用於比較變量間簡單相關係數和偏相關係數的指標,主要用於多元統計的因子分析。當全部變量的簡單相關係數的平方和遠遠大於偏相關係數的平方和時,kmo值越接近於1,原有變量越適合作因子分析。0.7-0.8適合,0.8-0.9很適合,0.9-1很是適合。0.6-0.7不太適合,0.5-0.6勉強適合,小於0.5不適合。BartlettP值小於或者等於0.01適合。算法
二、數據分析的方法包含( )、( )、( )等。
解答:描述性統計,迴歸分析。方差分析,假設檢驗。sql
選擇題。較爲簡單編程
簡答題。
一、某網站7月份共訪問用戶數4100人,已知訪問網站有兩種登錄方式A 和B 。使用A登錄的7月份總用戶數爲2835,使用B方式登錄的7月份總用戶數爲1400,既使用過A又使用過B登錄的7月份總用戶數爲985.
問:能夠看出,總訪問數—使用A登錄方式的總用戶數=1265,那麼A與B的重複用戶數=B登錄用戶數—1265=135,而實際獲得的既使用A登錄方式又使用B登陸方式的7月份總用戶數爲985,顯然這是矛盾的,問題出在哪裏?給出計算方法。編程語言
二、新浪公司樓下有一便利店,35平米,收銀員2位,天天提供早餐、中餐、晚餐。若是你來作估算,計算天天的營業額是多少?oop
三、抽樣估計的優良標準。
解答:無偏性,一致性,有效性。網站
四、寫出相關和迴歸分析的內容。
解答:相關分析是對兩個變量之間線性關係的描述和度量。
迴歸分析側重於考察變量之間的數量伴隨關係。排序
五、一道關於產品成本下降率和銷售利潤的直線迴歸分析的題目,記不清了。遞歸
2012新浪校園招聘數據分析師職位筆試題目。A卷(數據挖掘方向)
一、輸入兩個整數n 和m ,從數列一、二、3....n中隨意取幾個數,使其等於m,將其全部可能的組合列出來,若是考慮遞歸算法,請將算法的思路或者僞碼寫出來便可,求解思路:
二、有100我的作5道題目,第一道題目作的人有55人,第二道作對的人有89人,第三道做對的人有97人,第四道做對的人有79人,第五道做對的人有46人,已知至少做對三道纔是過關,問至少多少人過關?(提供的數字我已經記不清了就隨便寫的幾個)
三、證實根號2是無理數。
四、聚類分析方法對變量之間多重共線性的影響。
五、新浪公司樓下有一便利店,35平米,收銀員2位,天天提供早餐、中餐、晚餐。若是你來作估算,計算天天的營業額是多少?
2017年9月16日10點到11點作的在線筆試
第一次作數據分析的筆試題,跟開發崗的題目居然差異這麼大,暈暈的,已無力吐槽。
沒有開攝像頭的上機筆試,題目沒有看完,對,沒有看完。。。。
先是兩個選擇題,很簡單。
後面的題。。前方高能。
就寫一下有印象的吧,,
1.平均數,中位數,衆樹,方差,標準差的含義,並舉例子解釋。 2.你心目中的數據分析師是什麼樣的? 3.兩個水桶,一個小點的桶能夠裝4升水,大的桶裝11升水,問怎麼操做能夠兩個桶盛5升水? 4.數據分佈有哪些?選擇熟悉的數據分佈並寫出其適用的場景。 5.寫出三種熟悉的排序算法,選擇一個寫出其僞代碼。 6.Hadoop生態系統組件有哪些?寫出你熟悉的三個。 7.什麼是倖存者誤差? 8.寫出10種linux命令,寫出其參數。 9.用一種編程語言,實現1+2+3+4+5+.....+100 10.實現求1,2,3,...100之間的質數。 11.給幾個表,mysql語言編寫。(時間來不及,就沒有寫,挺複雜的) 12.給了三個圖表,全是英文的,對其作分析。 。。。。。 還有好多個題目,實在是沒有時間作了。 數據分析的筆試題差的太多了,又開始不知所措了。。。。。