你們好,前兩天有一個小夥伴加我微信諮詢。他說他不想讀研,想要直接本科畢業就參與工做。可是又擔憂本身因爲沒有學歷優點,沒法在校招當中得到機會,因而便來向我請教,能不能指點迷津提供一些具體的實操性措施。與他一番暢談以後,我本身回過頭來想一想,這的確是一個好問題,因此寫下了此文,和你們一塊兒分享一點我的的想法和心得。web
在回答問題以前,咱們先來思考一個問題。本科生和碩士的差距究竟有哪些?面試
這樣的差距實在是太多了,咱們隨便想一想就能想出來不少。好比說學歷,碩士階段每每能夠去到更好的學校, 擁有一個更好的文憑。好比說基礎知識,碩士階段能夠有導師以及師兄們指點,能夠在某個領域積累下豐富的知識。再好比說技能,三年時間跟着導師作項目能夠積累不少實戰經驗……算法
若是咱們反過來問,那本科生和碩士相比有什麼優點呢?微信
也許咱們想來想去可能也就只能想到年輕了,表面上來看的確如此。但實際上若是咱們進一步思考,你會發現碩士階段積累的能力和優點都和碩士階段研究方向有關。好比研究嵌入式的每每不瞭解機器學習,研究圖形渲染的每每也不瞭解神經網絡。既然碩士的能力和研究方向高度掛鉤,那麼若是咱們找到了一個工做崗位不少,可是不多有人研究的方向,是否是本科生同樣有機會呢?網絡
是的,的確如此,這也是本科生逆襲的核心邏輯。數據結構
在你們眼裏,研究生跟着導師作項目,有明確的方向會積累下大量的優點。乍一看這個說法很是正確,毫無破綻,可是若是瞭解內部行情的話,你會發現這裏面是有不少問題的。最大的問題是什麼呢?最大的問題仍是學術方向和工業方向脫鉤的問題。框架
爲何說CV和NLP內卷得比較厲害?道理很簡單,由於計算機視覺和天然語言處理是學術方向和工業方向重合緊密度比較高的兩個領域。想要從事這兩個領域的博士生和碩士生最多,那麼競爭也就最大。機器學習
但問題是,工業界的算法方向其實並不僅有這兩個,還有好比廣告、搜索、推薦、風控等等。這些領域當中有不少是和學術界的研究方向脫鉤的,好比推薦和廣告。我看了不少期刊的論文,大部分論文的做者都是某某公司的算法團隊,而不是一個學術機構。這說明了什麼?說明了學術內是不多研究這兩個領域的, 由於這兩個領域本就是面向實際應用的。編輯器
像是這些領域就是本科生很是好的突破點,由於和你競爭的碩士們即便是從事算法方向的,也沒有這些領域的經驗,而且他們當中明確想要作這個領域,而且都這個領域還有所瞭解的人就更少了。這就是一個很是好的突破口,能夠很輕鬆地積累很大的優點。ide
怎麼作呢?很簡單,就是去讀一些業內前沿的paper。好比你想要作推薦,那麼你就去把業內一些經典的論文讀一下。好比GBDT+LR、FM、Wide & Deep、DeepFM、DIN等等。讀完以後你寫在簡歷當中,自學了相關領域的知識,閱讀過這些論文。在我至今看過的幾十封簡歷當中,沒有一個有相關內容的,若是你的簡歷寫上了這些,毫無疑問是一個巨大的加分項。
讀一些論文並不須要花不少時間,可是就能夠做爲一個很大的亮點。而且你寫上以後,面試官頗有可能就會問這些論文或者是模型當中的問題,你只要可以答得上來,讓他以爲你是真的仔細讀過了讀懂了,經過面試幾乎沒有懸念。
對於校招生而言,不管什麼學歷,基礎都是很是重要的,也是面試當中佔比重很是大的一個部分。
說實話這一塊要學的東西仍是挺多的,不管是開發仍是算法都差很少,如今的要求都不低。若是是算法的話,須要熟悉機器學習、深度學習、TensorFlow或者是Pytorch框架、numpy等一些經常使用的庫和工具,還須要在算法和數據結構上有比較紮實的能力。若是是開發的話,須要深刻了解一門語言的特性,瞭解一些開發經常使用的框架,以及操做系統、計算機網絡等基礎知識。
怎麼看,咱們要學的東西都很多。不少人看到這些就望而卻步了,可是若是你明確了你想要從事的方向的話,其實你能夠過濾掉不少不相關的內容。
我舉個例子,在機器學習模型當中,推薦和算法領域看重的模型基本上都是一些和實際應用場景強相關的模型。好比說LR、貝葉斯、GBDT、XGboost、隨機森林等等。對於一些其餘領域的模型,好比什麼Apriori、FP Growth、高斯混合模型等等都是不關心的。那麼對於這些模型而言,咱們就能夠淺嘗輒止,大概瞭解原理便可。對於和行業高度相關的模型重點學習。
再好比深度學習當中,在推薦和廣告領域,幾乎不會用到卷積神經網絡和循環神經網絡,這些基本上都是CV和NLP的專屬,在推薦、廣告當中基本上用不到。既然用不到,那也能夠同樣操做,有所瞭解,淺嘗輒止便可。
當咱們明確了方向以後,能夠節省掉大量不相關的無效內容的學習,而更多地把精力投放在重要的領域上。這樣能夠大大提高咱們的效率。
你們都知道實戰經驗對於找工做來講很是重要,對於算法崗位而言,咱們的實戰項目都是須要大量的數據來訓練模型的。對於本科的同窗而言,一沒有渠道獲取這些數據,二沒有足夠的硬件條件(集羣、GPU)來訓練模型,因此只靠本身的摸索或者是去網上找兩個波士頓房價預測這樣的數據集是不夠的,咱們須要一點更加硬核一點的實戰內容。
這裏我強烈安利天池大數據比賽和kaggle,由於其中能找到不少電商場景下的問題,咱們去作這樣的比賽來鍛鍊實戰經驗是很是很是有效的。一方面能夠寫在簡歷當中充當項目經歷,另一方面也能夠積累咱們對電商行業以及推薦、廣告等業務領域的理解。
像是Kaggle當中也有不少相似的問題也很是不錯,好比咱們在kaggle當中搜索CTR,就能夠找到不少和推薦、廣告相關的比賽:
咱們從數據上也看得出來,搜索、推薦相關的比賽的參與人數比其餘的要少不少。這裏面的緣由就是我剛纔提到的,真正的從業者已經不須要刷這些比賽來作加分項了,而沒有從業者在學校裏面每每是接觸不到這兩個方向的,有明確地目標來進行練習和提高的就更少了。
因此只要能作到這一點,放在簡歷當中就是一個巨大的優點和亮點。
其實咱們總結一下這篇文章說的核心觀點只有一個,就是差別化競爭。咱們瞄準了學術界和工業界的脫節的領域發力,一方面直接的競爭者不多,另一方面,咱們能夠憑藉着明確的方向積累出優點來。在職場當中方向明確,在這個領域內持續的努力以及積累,是一個很是很是巨大的優點,不少狀況下要比一個碩士學歷有用得多。
今天的文章就到這裏,衷心祝願你們天天都有所收穫。若是還喜歡今天的內容的話,請來一個三連支持吧~(點贊、關注、轉發)