拉勾數據崗位和熱門編程語言現狀分析

功能點

爬取數據

  • 全部公司數據,名稱簡寫,城市,行業,職位數量,人數範圍,標籤,介紹,融資階段,平均工資
  • github2016年度最受歡迎編程語言相應年數薪水,城市,學歷要求,公司融資階段,公司行業
  • 大數據行業五大崗位相應年數薪水,城市,學歷要求,公司融資階段,公司行業,崗位要求

編程語言分析

  • 編程語言在不一樣城市(top10)的需求量
  • 編程語言在不一樣行業(top10)的需求量
  • 編程語言在不一樣融資階段的需求量
  • 編程語言相應工做年限薪水平均值

大數據崗位分析

  • 五個崗位的職位需求關鍵詞詞雲
  • 五個崗位在不一樣城市(top10)的需求量
  • 五個崗位在不一樣行業(top10)的需求量
  • 五個崗位在不一樣融資階段的需求量
  • 五個崗位相應工做年限薪水平均值

數據可視化

  • Bokeh
  • Echarts

開發工做

  • 編寫數據採集所用語言:python
  • 針對拉勾網反爬蟲的應對措施:前端

    • 加http頭假裝成瀏覽器;
    • 找臨界值更換IP;
    • 限制爬取頻率;
    • 設置代理池。
  • 使用多線程爬蟲:提升效率
  • 製做詞雲:jieba中文分詞,自定義詞典,wordcloud生成圖片
  • 分析結果可視化:bokeh,echarts

數據崗位分析結果

  • 數據崗位不一樣城市需求增加趨勢
    2016.02數據
    圖片描述
    2017.05數據
    圖片描述
    能夠看到TOP5城市依然未變,南京武漢的數據崗位增長明顯,數量上而言,整體翻倍
  • 數據分析崗位增加趨勢
    數據分析相關專業做爲新興行業在近一年來的發展勢頭迅猛,2016年10月以前的招聘信息十分稀少,但在短短四個月的時間內增加至一千多個。(2016.10-2017.1)
    2017.02數據
    圖片描述
    2017.05數據
    圖片描述
  • 數據崗位工資水平兩年內變化
    2015年數據崗位相應工做年限平均工資
    圖片描述
    2017.05數據崗位相應工做年限平均工資數據

    能夠看出,兩年內數據崗位的工資明顯提升,起薪近乎漲了一倍,各個年限增加趨勢也很明顯。java

  • 數據挖掘工資趨勢
    2015.12數據
    圖片描述
    2017.05數據
    圖片描述
    整體都比兩年前對應年薪高,而且高薪比例明顯提升
  • 數據崗位和普通開發不一樣年限工資對比
    普通開發崗位工資水平
    圖片描述
    數據崗位工資水平
    圖片描述
    3-5年和5-10年的工資水平沒有明顯增加,也許說明重複的勞動不能表明技術的增加
  • 數據崗位和普通開發崗位要求學歷對比
    圖片描述
    圖片描述
    能夠看出,數據崗位對學歷的要求較普通開發高,碩士的比例增長,並出現了博士的需求。
  • 詞雲結果實例
    數據架構師崗位要求詞雲
    圖片描述
    能夠看出對架構師而言,「開發」仍是最重要的,「架構設計」毫無疑問成爲關鍵詞,另外管理能力也有所要求
    數據分析師崗位要求詞雲
    圖片描述
    能夠看到數據分析師也須要掌握數據挖掘的技能。另外數學成爲了一個關鍵詞,編程語言主要是「SQL」,「SAS」等,運營也出如今詞雲中說明數據分析師也須要有運營能力。
    數據挖掘崗位要求詞雲
    圖片描述
    能夠看到算法成爲了一大關鍵詞,說明數據挖掘對算法的要求仍是挺高的,另外「計算機」和「數學」成爲了需求最多的兩個專業,編程語言方面「SQL」,「 JAVA」,「 R」都有要求。
    數據可視化崗位要求詞雲
    圖片描述
    能夠看到前端成爲了一個關鍵詞,另外可視化相應的工具如「ECHARTS」等也出如今詞雲中,交互和開發同時出現,這在其餘崗位是沒有的,說明可視化仍是須要視覺效果

2016github10大熱門編程語言現狀分析

  • 職位需求量

圖片描述

  • 所在行業

Python崗位所在行業
圖片描述
scala崗位所在公司行業
圖片描述
能夠看出Python的應用更廣,而Scala主要是數據服務行業須要。緣由是Python除了能夠用來作web開發,在科學計算等方面的表現也很出色。python

  • 崗位城市分佈(示例java)
    Java崗位城市分佈
    圖片描述
    能夠看出Java的整體需求仍是北上廣深杭比較多,而杭州數量多的可能也許是由於坐落在此的阿里巴巴內部使用Java較多
  • 崗位所在公司融資階段(示例PHP)
    圖片描述
    對PHP需求最多的是初創型公司,可能由於PHP能夠作到快速開發而且在中小規模公司比較適用。

多維度分析

普通開發不一樣城市不一樣工做年限平均工資
圖片描述
能夠看出,北京的總體工資水平最高,高薪主要集中在北上廣深杭,其中,杭州的工資水平也較高,可能由於杭州是阿里巴巴網易等大型互聯網公司總部所在地。git

不一樣融資階段公司工做年限不一樣平均工資
圖片描述
能夠看到1-3年和3-5年工資差距並不明顯,D輪及以上公司給的工資總體水平都比其餘融資階段高github

分析結論

  • 數據崗位集中在北上廣深,需求量呈爆炸式增加。
  • 數據崗位算法、學歷要求更高,對業務敏銳,薪資更高。
  • 門檻高的崗位需求量更少(Scala), 門檻低應用廣(Python)
  • 互聯網行業對人才的要求愈來愈高(算法、數學、業務)
相關文章
相關標籤/搜索