Python學習路徑和我的增值(整合版)

PS:內容來源於網絡html

1、簡介前端

        Python是一種面向對象、直譯式計算機程序設計語言,由Guido van Rossum於1989年末發明。因爲他簡單、易學、免費開源、可移植性、可擴展性等特色,Python又被稱之爲膠水語言。下圖爲主要程序語言近年來的流行趨勢,Python受歡迎程度扶搖直上。python

Python數據分析學習:120天Get新技能-數據導航
2、數據分析路徑

        因爲Python擁有很是豐富的庫,使其在數據分析領域也有普遍的應用。因爲Python自己有十分普遍的應用,本期Python數據分析路線圖主要從數據分析從業人員的角度講述Python數據分析路線圖。整個路線圖計劃分紅16周,120天左右。主要學習內容包括四大部分:
        1)Python工做環境及基礎語法知識瞭解(包括正則表達式相關知識學習);
        2)數據採集相關知識(python爬蟲相關知識);
        3)數據分析學習;
        4)數據可視化學習。
git

 

Python數據分析學習:120天Get新技能-數據導航

 

1)Python工做環境及基礎語法知識瞭解:
  對於Python基礎語法學習部分,學習週期大概爲4周,須要的相關資源在網絡上都能找到免費的資源,並且質量都不錯。相關中文資源以下:
  1.1python工做集成環境包
  Python(x,y):下載地址:http://python-xy.github.io/downloads.html
  Pycharm:下載地址:http://www.jetbrains.com/pycharm/download/#section=windows
github

  1.2python數據分析相關庫(Pandas/Numpy/Scipy/Matplotlib)
  若是安裝了上面集成工做包,則下面的包不須要從新安裝了。關於包的安裝方法在學習資源圖書中都有介紹,一般安裝庫採用pip方法,也能夠用pip list查詢系統安裝了哪些庫。
golang

  1.3學習資源
    1.3.1圖書:
    1)Python基礎教程(第2版)[電子版圖書自行百度]
    2)深刻淺出Head First python(中文版)[電子版圖書自行百度]
面試

    1.3.2在線教程:
    1)廖雪峯的python教程:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
    2)正則式學習:http://wiki.jikexueyuan.com/project/python-crawler-guide/regular-expressions.html#7907ec6cc04be6c7f8cf8ac272215946
正則表達式

    1.3.3視頻教程:
    1)慕課網python入門:http://www.imooc.com/learn/177
    2)慕課網python進階:http://www.imooc.com/learn/317
    3)正則式學習視頻:http://www.imooc.com/learn/550
算法

 

2)數據採集學習:
  對於數據採集部分的學習主要是經過python爬蟲的學習瞭解基本的外部數據採集狀況,固然也能夠藉助別人寫好的規則庫直接完成某些數據的採集。這部份內容的學習週期大概也爲四周,須要的相關資源在網絡上都能找到免費的資源,並且質量都不錯。相關中文資源以下:
sql

  2.1爬蟲學習在線教程:
  1.Python爬蟲入門一之綜述:http://cuiqingcai.com/927.html
  2.Python爬蟲入門二之爬蟲基礎瞭解:http://cuiqingcai.com/942.html
  3.Python爬蟲入門三之Urllib庫的基本使用:http://cuiqingcai.com/947.html
  4.Python爬蟲入門四之Urllib庫的高級用法:http://cuiqingcai.com/954.html
  5.Python爬蟲入門五之URLError異常處理:http://cuiqingcai.com/961.html
  6.Python爬蟲入門六之Cookie的使用:http://cuiqingcai.com/968.html
  7.Python爬蟲入門七之正則表達式:http://cuiqingcai.com/977.html
  8.Python爬蟲實戰一之爬取糗事百科段子:http://cuiqingcai.com/990.html
  9.Python爬蟲實戰二之爬取百度貼吧帖子:http://cuiqingcai.com/993.html
  10.Python爬蟲實戰三之計算大學本學期績點:http://cuiqingcai.com/997.html
  11.Python爬蟲實戰四之抓取淘寶MM照片::http://cuiqingcai.com/1001.html
  12.Python爬蟲進階一之爬蟲框架Scrapy安裝配置:http://cuiqingcai.com/912.html

  2.2視頻教程:
  Python簡單爬蟲開發:http://www.imooc.com/learn/563

 

3)數據分析:
  Python數據分析的學習主要是對相關庫的使用,好比數據整理須要用到numpy和pandas庫,數據描述與分析分析則主要用到pandas庫,從某種程度上講,利用python進行數據分析的學習過程就是對庫的學習過程。因爲有了前面2部份內容的學習基礎,本部份內容的建議學習練習時間也爲4周,相關免費學習資源以下:

  3.1學習資源
    3.1.1圖書:
    利用python進行數據分析:http://item.jd.com/11352441.html[電子版圖書自行百度]

    3.1.2視頻:
    用python玩轉數據:https://www.coursera.org/learn/hipython[視頻爲cousera認證課程,全程中文]

  3.2數據分析的準備
  1.瞭解數據——數據加載、儲存與文件格式;異常值的清理與缺失值處理
  2.數據清洗與初步分析——數據清理、轉換、合併與重塑;數據彙總與描述統計;
  3.繪圖與可視化——基本繪圖命令與圖形概覽、圖形元素設定與實例:地震危機數據的可視化
  4.數據聚合與分組處理——數據聚合、分組運算與轉換、透視表與交叉表
   
  3.3數據分析初探
  1.假設檢驗——經常使用假設檢驗與實例分析
  2.線性迴歸——線性迴歸模型、分析結果呈現與解讀;實例:商品價格預測
  3.logistic迴歸——logistic迴歸模型講解;實例:電信客戶流失分析
  4.時間序列分析——時間序列基本處理、時間序列模型構建與結果解讀;實例:將來股票價格預測
 
  3.4深刻數據分析
  1.分類算法——knn、決策樹、貝葉斯分類器等算法介紹;實例:網頁註冊用戶預測
  2.聚類算法——k-means算法介紹;實例:通訊基站聚類分析
  3.降維方法——主成分分析與因子分析算法介紹;實例:地區經濟指標評分
 

4)數據可視化:
  Python數據可視化學習的過程就是學習matplotlib庫的過程,matplotlib庫包含有豐富的數據可視化資源,地圖、3D等等都有涉及,若是有前面3部分的學習經驗的話,這部份內容在4周內也能解決。相關中文學習資源以下:

  4.1圖書:
  Python數據可視化編程實戰[電子版圖書自行百度]:http://item.jd.com/11676691.html

  4.2在線教程:
  1.利用Python繪圖和可視化(1):http://www.lovedata.cn/ec/Python/2016/0118/7732.html
  2.利用Python繪圖和可視化(2):http://www.lovedata.cn/ec/Python/2016/0118/7733.html

  至此,Python數據分析相關學習內容介紹完了,上面介紹的多種資源,每一個階段只需選擇其中的一種進行深刻便可,更多更深的內容則須要本身去實踐摸索。更多數據分析學習及數據分析工具參見數據導航網站。

 

3、其餘資源

1.百度雲:http://pan.baidu.com/s/1YPLT0

2.有道雲筆記:http://note.youdao.com/share/?id=3e1d9299f8680bcaa416b7f98c34f13e&type=notebook

3.用Python玩轉數據 Data Processing Using Python  https://www.coursera.org/learn/hipython

4.利用Python繪圖和可視化(1)  http://www.lovedata.cn/ec/Python/2016/0118/7732.html

5.利用Python繪圖和可視化(2)  http://www.lovedata.cn/ec/Python/2016/0118/7733.html

6.Python 中文官方文檔

7.python入門基礎教程 http://wiki.jikexueyuan.com/list/python/

 

4、我的增值

第一部分:一些要求

1.學歷
格式:計算機及相關專業本科及以上學歷…..

不解釋,不說明

畢業後不多再看學歷了,更多的是看能力吧(我會告訴你第一年周圍都是碩士博士海龜麼,俺學歷最低,自卑啊)

見過數學系、物理系、信息自動化系的跑過來當碼農,惟一遺憾的是尚未見到中文系的…..

2.經驗
格式:擁有X年以上經驗,至少獨立負責過X個項目

很蛋疼的東西,見過一年經驗用N年的,也見過一年擁有N年經驗的

受環境影響,但更多的是取決於我的

聽過一句話:人和人的惟一區別,就是有木有主觀能動性(略有些偏激,可是有道理)

3.基礎素質
格式:具備良好的XXXX

編碼規範/風格
文檔書寫習慣
溝通與表達能力,邏輯思惟清晰
團隊合做
動手能力/獨立工做能力
進取心,求知慾,工做熱情
善於學習,樂於分享,快速學習能力
能承受較大的工做壓力
執行力
責任感
英文閱讀能力
創新精神
對新技術敏感
獨立分析、設計、解決問題的能力

這些都相對比較「虛」,不怎麼好考察,面試+試用能夠相對客觀瞭解是否符合

我的認爲,責任感+執行力,這兩點足夠了,其餘通常不會差。

自我驅動的人,永遠會getthingsdone.因此會不斷去彌補本身的短板,其餘對應能力即便不足,也能很快彌補

4.加分項
格式:XXXX優先

使用*nix系統
vim/Emacs編輯器
對開源技術有強烈興趣和愛好,參與提交bug/patch
各類技術/經驗(前端/hadoop/機器學習/數據挖掘/函數式編程)

爲毛不是osx系統(╯‵□′)╯︵┻━┻

從一些側面,查看一我的的特質吧

5.提供
格式:XXXX帳號/地址

博客地址
github/bitbucket
stackoverflow
知乎
微博

搞技術的,頗有必要創建本身的領地,搞一些東西

分享,更重要的是積累

第二部分:乾貨

關於Python後端開發要求

1.對Python有興趣,熟悉Python(標準庫)
最好閱讀過源碼

瞭解Python的優化(熟悉pypy更佳)

2.至少至少一門語言(不說「精通」)
起碼熟悉其餘基本語言

C/C++LispHaskellSchemegolangerlangJavaRRubyNode.jsPHPPerlLua

我選了Java(曾經擅長)/Golang/Lisp/Ruby/C/C++

3.數據結構和算法
數據結構和算法基礎紮實

4.Python框架
Django/Tornado/Flask/Gevent/Web.py/Bottle/Celery/Twisted/NumPy

5.熟悉Linux
基本操做和命令
會Shell
版本Git/Svn
部署相關:Nginx/Gunicorn/Fabric/Virtualenv

6.數據庫
熟悉Mysql等關係數據庫使用
熟悉數據庫設計
熟悉數據庫調優/優化
有NoSQL使用經驗Redis/MongoDB等

7.後端技術相關
Redis
Memcached
RabbitMQ/ZeroMQ

8.網絡編程基礎
熟悉tcp/ip協議,熟悉網絡編程
瞭解常見的網絡模型
多線程

9.前端相關
熟悉Web開發相關知識
熟悉HTML/CSS/Javascript/JQuery
熟悉AngularJS

10.其餘
數據抓取,爬蟲
beautifulsoup/scrapy

機器學習/數據挖掘/天然語言處理(推薦算法)

TDD
高併發系統
大容量存儲系統
消息系統

Linux系統編程/網絡編程

基於此,去構建本身的技能體系,而後針對各項逐漸深刻

就這些,騷年,努力練級去吧

相關文章
相關標籤/搜索