如今因爲人工智能的大熱,這方面的人才稀缺,薪資水平不用說,行業中的NO.1,因此各路人馬紛紛集結互聯網行業,有轉行的,有轉崗的。對於初學者在學習這方面確定有許多疑問,是什麼疑問呢,我在這裏一 一給你解答。前端
1、首先要搞清楚一個概念,什麼是大數據。java
大數據又稱巨量資料,就是數據量大、來源廣、種類繁多(日誌、視頻、音頻),大到PB級別,現階段的框架就是爲了解決PB級別的數據。python
在這裏仍是要推薦下我本身建的大數據學習交流羣:606~859~705,這裏面都是學大數據開發的,若是你正在學習大數據 ,小編歡迎你加入,你們都是軟件開發黨,不按期分享乾貨(只有大數據軟件開發相關的),包括我本身整理的一份最新的大數據進階資料和高級開發教程,歡迎進階中和進想深刻大數據的小夥伴加入linux
專業的來說:大數據(big data,mega data),或稱巨量資料,指的是須要新處理模式才能具備更強的決策力、洞察力和流程優化能力的海量、高增加率和多樣化的信息資產。 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用全部數據進行分析處理。大數據的5V特色:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值密度)、Veracity(真實性)。git
2、學習大數據須要什麼語言基礎?web
首先,學習大數據是須要有java,python和R語言的基礎。算法
1)Java學習到什麼樣的程度才能夠學習大數據呢?java須要學會javaSE便可。javaweb,javaee對於大數據用不到。學會了javase就能夠看懂hadoop框架。數據庫
2)python是最容易學習的,難易程度:python < java < Scala 。python不是比java更直觀好理解麼,由於會了Python 仍是要學習java的,你學會了java,再來學習python會很簡單的,一週的時間就能夠學會python。編程
3)R語言也能夠學習,可是不推薦,由於java用的人最多,大數據的第一個框架Hadoop,底層全是Java寫的。就算學會了R仍是看不懂handoop。架構
java在大數據中的做用是構成大數據的語言,大數據的第一個框架Hadoop,底層全是Java寫的 ,因此推薦首選學習java。再給大家舉例說明下它們的分工和做用,java注重業務,大數據注重數據,前端是臉(頁面顯示),java是胳膊(業務),大數據是直男大腦,人工智能,深度學習是有情商的大腦。
例:
你:我渴了
直男大腦:呵呵,多喝水!
情商大腦:我這裏有橙汁,礦泉水,綠茶,你喜歡哪一個?不過看你平時喜歡喝飲料,要不要來一杯橙汁。
3、職業發展方向
學會了大數據,不須要從java作起,能夠直接作大數據開發工程師等積累了幾年的經驗, 就能夠作算法工程師了。看看學會了大數據能夠從事哪些崗位:
大數據開發工程師
數據分析師
hadoop開發工程師
spark開發工程師
數據倉庫開發工程師
數據清洗工程師(ETL)
大數據架構師
算法工程
4、優點
大數據受國家大力支持大量的資源都投資在這方面,大數據中心在貴州落坐,人工智能和雲計算都基於大數據,須要大批大數據人才。
5、大數據人才薪資待遇
通常的一線城市大數據相關崗位平均月薪在12-15K 北京平均17K,大數據算法工程師,年薪在30萬—50萬左右。
6、學習大數據有學歷/專業 有要求嗎
高中也找到工做,可是大專以上學歷更好,雖然是本科學歷,但大學四年中也沒有學習到實際的操做技能,學習到的東西在工做中用不到,只是在理解某些東西容易些。
7、大數據抓取數據手段有哪些?
爬蟲、Flume
8、學大數據用會java的那些框架嗎
SSHSSMSpringBootSpringCloud 這些框架在大數據中不會用到,對於學習技術的人來講,固然懂得這些技術會更好。
9、學習路線
javaSE + linux + Hadoop生態圈 + Strom + Spark + 算法
正常來說學習大數據以前都要作到如下幾點:
1.學習基礎的編程語言(java,python)
2.掌握入門編程基礎(linux操做,數據庫操做、git操做)
3.學習大數據裏面的各類框架(hadoop、hive、hbase、spark)
這是正常學習大數據必需要作到的三個步驟,若是有了java基礎再去學習基本上已經成功了一半,起碼不用爲了基礎語言的學習而惱火了。真正的大數據的學習不能僅僅停留在理論的層面上,好比如今常常用到的spark框架目前支持兩種語言的開發java或者Scala,如今python語言也能支持了。大數據的方向的切入是全方位的,基礎語言的學習只是很小的一個方面,編程落實到最後到編程思想,有了指導思想學習起來就能方便不少。