爬蟲工程師大廠面試真實際遇,試題你來挑戰一下?

面試不是一錘子買賣,一般須要 3~6 輪面試,遂須要準備的內容挺多的,請聽我詳細道來。面試

假設你面試的是知名互聯網企業的研發崗位,那麼面試大機率是 4 或 5 輪:算法

  1. 第一輪 同事面
  2. 第二輪 主管面
  3. 第三輪 經理面
  4. 第四輪 HR 面
  5. 第五輪 HR + 大領導

不管哪一輪面試,你都得主動提出「我簡單地介紹一下本身」,遂自我介紹確定是要有的。自我介紹要描述清楚你叫什麼、多少歲、多少年工做經驗、你以前是作什麼的、此次面試打算面什麼崗位、主要的技術棧是什麼以及本身的高光時刻。下方簡介可做爲參考:數據庫

您好!我叫鎮嶽劍,今年 30 歲。畢業參加工做已有 7 年。前幾年從事的是金融方面的工做,2015 年才轉行 IT。 主要編程語言爲 Python,職業方向爲爬蟲工程師,在爬蟲領域主要研究的是爬蟲技術和爬蟲架構。設計並親手搭建過日均數據量過億的爬蟲架構,期間使用了分佈式和容器化相關的知識。目前我已離職,可隨時到崗。 以上就是個人基本狀況,謝謝!編程

面試時遇到的面試官考察的內容都是不一樣的,遂你要準備不一樣層次答案。我面試過挺多家企業的,其中包括了咱們耳熟能詳的幾個大廠,整理了高級爬蟲工程師面試過程當中實際遇到的問題:服務器

第一輪常見問題

備註:假設這輪是技術一面網絡

一、請你簡單介紹一下本身架構

二、按照簡歷上的工做經歷和內容詢問細節,例如:編程語言

  • 你爬過 abc 和 asc,期間有沒有遇到什麼困難,你是如何完成的?
  • 請說說你在團隊中充當的角色和主要負責的部分。
  • 我看你參與了 sail 的開發,當時大家爲何要開發這樣一個平臺,而不是考慮用別的方式替代?
  • 你工做期間遇到過哪些反爬蟲?都能解決嗎?怎麼解決的?
  • 你爲何從上家公司離職?

三、經過交談了解我的能力,例如:分佈式

  • 你知道的排序算法有哪些?它們的時間複雜度分別是?
  • 你能清楚描述邏輯的排序算法有哪幾個,說來聽聽。
  • 你的主要編程語言是 Python,那你說說 Python 中深淺拷貝的區別和實現
  • Python 的 yield 關鍵字有什麼做用?
  • 講講你瞭解的網絡協議的構成和雙端交互流程。
  • 你經常使用的數據庫是?爲何會選擇它。
  • 有在項目中用過消息中間件嗎,例如 Kafka、RabbitMQ 之類的。

四、對某個技術點深刻討論,例如:性能

  • 你說說點選驗證碼的正向校驗流程和爬蟲工程師的技術流程。
  • 鼠標軌跡通常是怎麼記錄的?
  • 怎麼模擬鼠標軌跡,成功率高的算法有多高?
  • 你用技術能經過哪幾個驗證碼的驗證?
  • 你認爲經過率受到哪些因素影響?

五、你有什麼要問個人?

第二輪常見問題

備註:假設這是技術二面

一、請你簡單介紹一下本身

二、找優勢與缺點,例如:

  • 你說說擅長哪些方面。
  • 如今有一個場景,假設須要按預告時間爬取實時體育數據(例如籃球賽事,包括隊伍比分、球員得分、陣容等),你如何確保爬蟲程序可以及時、穩定且準確地將需求團隊要求的數據傳遞過來?
  • 說說網頁端常見的反爬蟲手段和解決的辦法。
  • JavaScript 逆向你通常怎麼作的,先如何,再如何?
  • 若是遇到硬茬,你一般怎麼作?
  • 代碼混淆的手段有哪些?怎麼實現的?
  • APP 逆向你如今到什麼程度?
  • 講講 hook 原理和具體的操做過程。
  • 有沒有使人眼前一亮的反爬蟲思路或者破解思路?
  • 你如今技術方面有哪些瓶頸或者以爲能夠提高的地方?

三、你有什麼要問個人?

第三輪常見問題

備註:假設這是技術三面;另外,作題也有可能在第二輪

一、作題一般有幾種狀況,例如:

  • 這有幾道題你作一下,N 時間交給我
  • 這有幾道題你作一下,如今作
  • 這有幾道題,不限時間,你作出來了告訴我

二、題目範圍大體分爲幾種,例如

  • 編程知識、語言知識和爬蟲知識,例如語言特性、網絡協議知識和程序設計等
  • 算法題,例如你按照題目指引給的輸入和輸出實現一個程序。我遇到過的有排序、樹、圖
  • 這有幾個網站,你須要獲取 ass 上的信息數據

三、講講你作題的思路,例如:

  • 這一題爲何這麼作,有什麼好處?
  • 你能夠採用其餘方式完成嗎?
  • 描述一下作題過程。

第四輪常見問題

備註:假設第四輪是 HR 或者 HR + 領導

一、請你簡單介紹一下本身

二、說說你在 3 至 5 年間的我的計劃吧,技術、生活之類的。

三、你對本身的職業發展有沒有什麼期待?

四、你爲何從上一家公司離職?

五、爲何選擇咱們公司?

六、除了爬蟲技術以外,你對什麼技術也會感興趣?

七、聊聊你出版圖書的經歷

八、咱們這邊出了名的壓力山大,你以爲你可以適應嗎?

九、你如今的收入是多少,按年算

十、你指望薪資是多少,按年算或者按月薪

十一、你有什麼要問個人?

其中不乏關聯性很強的連環炮問題,若是你可以流暢應答,說明你的技術能力很紮實。若是遇到難以回答的問題或者答不對,那就說明你還有不少須要補強的地方,加油!

補充:靠後的面試中會問不少跟真實需求有關的問題,例如通訊、多機資源監控和管理、主動監控數據、性能提高,對應的問題例如:

  • 如何在有限的 QPS 狀況下保證可以獲取到有效的、優質的數據?

  • 如何實現主動監控數據,一旦結構或數據發生變化就可以獲得通知?

  • 你設計一組調度架構,如何能保證服務器資源最大化利用?

好消息是東鴿已經收到了 1 個 offer,另外兩個大廠也走到了最後一輪 HR 面,目前在等電話的狀態中,離多個 offer 只是時間問題了。

實戰題方面,原本我想放出來的,但後來一想我不能泄漏別人題目,這裏我建議你們到專門的刷題網站(例如牛客)找一些大廠真題作作。

img

刷一刷能夠保持競技狀態,同時熟悉遠程在線作題的規則和方式,雖然不必定在面試時發揮直接做用。我在面試 HUAWEI 前看過一些真題,但實際面試時遇到的倒是另外一種題,因爲我提早熟悉了在線面試的作題規則,最後有驚無險地拿到了 100 分。

若是我沒熟悉作題規則和方式,恐怕作題時間要超時……,由於沒作過在線題的你實在是難以搞懂題目要求和對應的交付方式。

相關文章
相關標籤/搜索