百度研發面經

本文出自個人公衆號:程序員江湖。
更多技術文章和校招乾貨,請關注個人公衆號。node

百度研發面經程序員

百度智能雲面試

軟件研發工程師正則表達式

        百度今年的提早批有點奇怪,好像都不走流程,牛客上好幾個百度內推的帖子,我投了幾個,基本上都是百度智能雲的。  算法

        而後這些部門都安排了面試,沒有衝突,因此沒有動靜的小夥伴能夠投投別的部門試試。  shell

        下面是個人兩篇面經,後續會繼續更新,每一個部門側重點不太同樣。數據庫

 **設計模式

<section data-style-type="6" data-tools="新媒體排版" data-id="9106">數組

百度智能雲研發崗  瀏覽器

好像是作控制檯方面的組

一面:  

1自我介紹,項目

2 static關鍵字有什麼用,static修飾不一樣東西時有什麼做用,內部類用static修飾和不用static修飾有何區別。

3 hashmap,hashtable,concurrenthashmap區別和場景

4 volatile關鍵字有什麼用

5 jvm分區講下,做用講下,gc算法講一下,gc是否會有停頓或者延遲。

6 講一下OOM和內存泄漏的例子,爲何有GC還會出現內存泄漏和內存溢出呢

7 線程和進程的區別,通訊方式的區別。

8 悲觀鎖和樂觀鎖,說一下Java和數據庫分別怎麼實現的。

9 數據庫索引說一下,除了B+樹索引還有什麼索引。

10倒排索引說一下,若是關鍵字不少,怎麼優化。使用前綴樹和hashmap優化。

11 前綴樹的結構和原理說一下。

12 瀏覽器發起http請求過程,越詳細越好。

13 緩存和數據庫的一致性怎麼保證

14 網上寫代碼,寫了一個快排

15 沒了。

二面:  

1 自我介紹

2 項目中難點,用到的技術

3 多線程,說一下線程的狀態和狀態轉換,詳細問

4 多線程的sleep方法和wait方法爲何來源不一樣,一個是object方法,一個是Thread的方法。

5 爲何object的wait和notify必須在同步塊中使用,不在同步塊使用會報錯麼,編譯報錯仍是運行報錯。

6 jvm講一下gc吧,兩個對象的引用循環依賴,會不會被垃圾回收,什麼狀況下會什麼狀況下不會呢

7 GC root是哪些位置呢,我說記不起來,他說你不用記,其實就是運行時的一些對象和變量,好比局部變量表,方法區的元數據好比fianl,static變量,本地方法棧執行的方法。  

8 數據庫瞭解哪一個。Redis說一下爲何是單線程的,不會很慢麼,有什麼好處。

9 Redis的IO請求模型,是否是IO多路複用呢。

10 Spring的interceptor和filter有什麼區別。我說沒區別,錯!

11 網絡這塊,說一下dns請求的過程吧,dns是否會訪問緩存呢,緩存在本地和瀏覽器,還有dns服務器上是否是都有。

12 get和post的區別講一下,底層的實現有區別麼,都是基於TCP,那麼如何限制get的url長度,在哪一層限制的。

13 數據結構熟麼,講一下樹和圖吧,樹的層次遍歷使用什麼結構,相應的圖的遍歷呢。講講最小生成算法,還有迪傑斯特拉。

14 數組,找到惟一一個出現兩次的數。

剛開始聽錯,說了位運算。

a 而後講了數組計數,hash計數,排序比較。

b 而後面試官說條件給的是1到N-1的N個數字,從新想一下。

c 說了根據數組位置和數字比較進行判斷。面試官最後說能夠用相加求差值來判斷。

15 一個10000如下的數組,內存夠。裏面只有1,2,3。排下序。

a 普通排序O(nlogn)

b 荷蘭旗問題,雙指針解決。O(N)

c 統計數量,重放數組O(2N)

d 另外搞一個數組,把1放頭,3放尾,也是雙指針。O(N)。空間複雜度O(N)

16 沒了。

全程50分鐘

三面HR  

巴拉巴拉巴拉。基本上問題都大同小異。

百度智能雲 數據庫部門  

一面:  

1 數據庫的事務,四個性質說一下,分別有什麼用,怎麼實現的。一致性沒講好。

2 講到了redo和undo日誌,問我分別有什麼用,說redo日誌說錯了。

3 數據庫的隔離性如何保證,使用悲觀鎖和樂觀鎖有何區別。MVCC的設計目的是什麼,怎麼使用版本號判斷數據的可見性。

4 問了一道算法,1到N的全部數字,按照字典序打印,怎麼作。

說了用數組排序,問複雜度,扯了半天。

怎麼優化,按照數字特徵順序打印,問這個東西和什麼結構比較像。提示是樹,而後說了個多叉樹,問我怎麼實現,最後其實使用dfs遍歷樹的每一個分支。

5 多線程併發的同步實現,有兩個方法,每一個方法裏有a部分代碼和b部分代碼,我要讓兩個線程分別執行兩個方法,而且讓他們運行完a部分代碼再一塊兒向下執行,如何實現。

6 我說了用cyclicbarrier實現,互相等待await。

而後他問我怎麼用信號量實現,而且提示能夠再用一個線程。

而後我說了個方案。

7 問了項目

8 如何把優化遞歸的代碼

改爲尾遞歸或者循環。

面試官說不是,引導說用棧實現遞歸。

問我棧中須要壓入哪些數據。他說應該是方法參數,返回值,以及返回地址。

二面:  

1 自我介紹,項目 10分鐘過去

2 服務器如何負載均衡,有哪些算法,哪一個比較好,一致性哈希原理,怎麼避免DDOS攻擊請求打到少數機器。

3 TCP鏈接中的三次握手和四次揮手,四次揮手的最後一個ack的做用是什麼,爲何要time wait,爲何是2msl。

4 數據庫的備份和恢復怎麼實現的,主從複製怎麼作的,何時會出現數據不一致,如何解決。

5 今天面試太多了,記不清了。。。

6 開源的技術看過用過麼,分佈式存儲的瞭解麼。

7 想作什麼方向的開發。

8 Linux查看cpu佔用率高的進程

9 查看佔用某端口的進程和某進程監聽的端口

10 如何查詢日誌文件中的全部ip,正則表達式

三面(8.3號更新):  

數據庫部門真的很嚴格,問題都挺難的。

1 講一下項目

2 平時瞭解什麼操做系統

Linux,說一下Linux排查問題經常使用的命令,ps,top,netstat,free,du等等

3 Linux的內存管理算法,問了一下是否是頁面置換算法,他說是。

說了lru和fifo,問我lru有什麼缺點,沒答上來。

4 Linux的文件系統瞭解麼,講了一下inode節點,文件和目錄的原理。他問我了不瞭解具體的文件系統ext2,ext3,答不會。。

5 進程通訊方式有哪些,問我分別怎麼使用,管道有哪些類型,各有什麼優缺點。

6 問我服務器硬件瞭解麼。。一臉懵逼,問了我懂不懂Raid,瞎扯了幾句就說不懂了。

7 shell瞭解麼,沒怎麼寫過。

8 據說你會Java,說一下JVM內存模型把,有哪些區,分別幹什麼的

9 說一下gc算法,分代回收說下。

10 設計模式瞭解麼,說了7種,問我分別怎麼用,實際應用過嗎,稍微扯了一下。

11 MySQL的引擎講一下,有什麼區別,使用場景呢。

12 查詢最新的10條數據,想了好一會,order by id desc limit 10

13 MySQL的union all和union有什麼區別,我瞎掰了一下,應該不對。

14 MySQL有哪幾種join方式,底層原理是什麼,答不會,只知道表現形式。

15 Redis瞭解哪些啊,數據結構和基本原理把。

問我Redis怎麼作集羣,答了主從哨兵和cluster。

Redis的持久化怎麼作,aof和rdb,有什麼區別,有什麼優缺點。

16 Redis使用哨兵部署會有什麼問題,我說須要擴容的話仍是得集羣部署。

17 分佈式系統瞭解麼,說一下Hadoop瞭解啥。

我說基本組件稍微瞭解過,簡單搭過環境。

18 MapReduce的combiner幹啥的,我說是合併結果的,問我啥時候會用到,答不知道。

19 Hadoop分發任務時,有個job失敗了,hadoop會怎麼處理,我答不知道,猜是會繼續執行。。

20 hadoop分發任務,若是有一個節點特別慢拉慢了總體速度怎麼辦。我猜想是經過yarn分配相同的資源給每一個任務,能夠避免這種狀況,他好像不太滿意。

21 hadoop答得很爛。問了我兩個10g文件比較,2g內存,重複率很高,篩選出不一樣的內容。我說拆成十份hash,每份兩兩比較hash的結果集,貌似他說OK。

22 排序算法瞭解哪些,巴拉巴拉。

23 用隊列計算一個樹的高度,我說用層次遍歷記錄節點高度。

24 一個黑名單集合,數據量很大,快速查詢一個值是否在集合裏,怎麼設計,我說布隆過濾器。

25 仍是上一題,說這個黑名單可能須要動態地增刪改,如何設計才能避免訪問響應太慢。我沒思路,瞎扯了一下加硬件,用內存存,都被駁回了。而後他說算了。

26 上一題的黑名單作成分佈式,怎麼作。說了分片的方案,根據地址的hash值肯定分片所在節點。

27 分佈式數據庫瞭解麼,我不太明白他問的是啥,說不了解,感受應該是問數據庫的分佈式方案。

28 有什麼想問的,據他所說還有2-3輪面試,驚了。

全程50分鐘,能夠說是迄今爲止難度最大的一個?

▼更多精彩內容

騰訊研發面經

阿里中間件研發面經

大俠,這裏有乾貨!

喜歡記得來一個

相關文章
相關標籤/搜索