第7期 Datawhale 組隊學習計劃

立刻就要開始啦html

此次共組織15個組隊學習python

涵蓋了AI領域從理論知識到動手實踐的內容面試

按照下面給出的最完備學習路線分類正則表達式

難度係數分爲低、中、高三檔算法

能夠按照須要參加數據庫

- 學習路線 -

image

image.png

基礎知識

01 統計學

課程設計:王佳鑫、許輝編程

組隊學習說明:學習內容涵蓋統計學中全部的主要知識,並對其分部分進行梳理總結。數組

任務路線:根據所學習內容進行服務器

(1)統計學基本知識、二項及泊松分佈、大數定律、正態分佈等內容的總結進行總體的回顧、梳理與完善;網絡

(2)中心極限定理、置信區間、 假設檢驗等內容的總結進行總體的回顧、梳理與完善。

組隊學習週期:7天

定位人羣:微積分、基本機率知識儲備,難度係數中

每一個任務完成大概所需時間:2-3h

任務預覽(2天)

學習內容 1:統計學基本知識、二項及泊松分佈

學習內容 2: 大數定律、正態分佈

02 Python基礎

課程設計:馬晶敏,葉梁、許輝

組隊學習說明:學習python基礎知識,針對python小白的學習之路

任務路線:基礎知識-函數-第三方模塊-類和對象-基礎爬蟲

組隊學習週期:10天

定位人羣:python小白,難度係數低

每一個任務完成大概所需時間:天天平均花費時間2小時-4小時不等,根據我的學習接受能力強弱有所浮動

任務預覽(2天)

環境搭建

1.python初體驗

2.python基礎講解

3.python變量特性+命名規則、註釋方法、python中「:」做用、學會使用dir( )及和help( )、import使用、pep8介紹

  1. python數值基本知識

python中數值類型,int,float,bool,e記法等、算數運算符、邏輯運算符、成員運算符、身份運算符、運算符優先級

03 編程

課程設計:光城 、LeoLRH

組隊學習說明:利用本身所熟知的編程語言,具備必定基礎,討論在面試中可能出現的數據結構問題,一塊兒學習重溫經典數據結構

任務路線:數組->鏈表->棧->隊列->遞歸->排序->二分查找->哈希表->字符串->二叉樹->堆->圖->回溯->分治->動態規劃

組隊學習週期:14天甚至往上大概16天左右(週末進行總體整理討論)(天天任務時間具體看任務狀況)

定位人羣:有一門語言基礎和算法基礎的同窗,難度係數高,小白慎入!!!

每一個任務完成大概所需時間:平均天天學習時間在1個小時左右,晚上統一,半個小時進行集體討論總結打卡。

任務預覽(2天)

【數組】

實現一個支持動態擴容的數組

實現一個大小固定的有序數組,支持動態增刪改操做

實現兩個有序數組合併爲一個有序數組

學習哈希表思想,並完成leetcode上的兩數之和(1)及Happy Number(202)!(要求所有用哈希思想實現!)(選作)(注意:在第四天會進行繼續學習)

練習:

Three Sum(求三數之和)

Majority Element(求衆數)

Missing Positive(求缺失的第一個正數)

【鏈表】

實現單鏈表、循環鏈表、雙向鏈表,支持增刪操做

實現單鏈表反轉

實現兩個有序的鏈表合併爲一個有序鏈表

實現求鏈表的中間結點

練習:

Linked List Cycle I(環形鏈表)

Merge k Sorted Lists(合併 k 個排序鏈表)

04 leetcode

課程設計:老表、於鴻飛、楊皓博

組隊學習說明:Leetcode刷題組隊學習,從零開始天天一道算法題,在良好的學習氛圍下,培養刷題習慣,學習算法思想。(不限制編程語言)

任務路線:騰訊精選練習(50 題)順序天天一道題。

地址連接:

leetcode-cn.com/problemset/…

組隊學習週期:50天(50題所有完成即結束)

定位人羣:適合有一門語言基礎的同窗,難度係數中

每一個任務完成大概所需時間:2-3h

課程內容:選取騰訊精選練習(50 題)解答

數據分析/挖掘

01 Excel入門課程

課程設計:楊煜,李嚴

組隊學習說明:職場人士必備學習內容。經過集中式學習和大量實戰練習,快速瞭解並掌握Excel核心功能,保證從此工做中用獲得。

任務路線:基礎界面(2天) --> 基礎文件操做&單元格操做(2天) --> 基礎函數(2天) --> 查找函數vlookup和 match/index(2天) --> 基礎圖表(3天) --> 數據透視表(2天)

組隊學習週期:11天

定位人羣:小白或有一點基礎但不熟練的人羣;初入職場人羣必學;難度係數低

每一個任務完成大概所需時間:2-3h/天天

任務預覽(2天)

文件操做

新建workbook

新建sheet/移動sheet/重命名sheet/修改sheet顏色、sheet種類: 工做表/圖表/宏表等、保存爲xls/xlsx/csv

基礎單元格操做

輸入數據、數據格式、合併單元格、自動填充、選擇性粘貼、去重、分列、排序、篩選、條件格式、插入下拉列表、行高列寬設置、凍結首行首列、邊框、單元格換行

做業:

任務一:

生成一個行高30,列寬15(第六列列寬45),名爲「Excel組隊學習」的表,凍結窗格1-3行

任務二:

操做對象爲任務一輩子成的「Excel組隊學習」表

將第六列分列,效果以下

利用條件格式,將薪資列大於8000的收入填充爲深綠色,並將它們篩選出來

第二列將重複值刪除,只保留惟一值

02 MySQL

課程設計:楊皓博 孫濤 楊煜

組隊學習說明:一週內快速瞭解並掌握MySQL的主要內容。經過大量SQL語句的實戰練習,能夠在簡歷上寫熟練掌握MySQL。(注意:本課程只關注SQL查詢語句自己,對數據庫的涉及較少。)

任務路線: MySQL軟件安裝及數據庫基礎->查詢語句->表操做->表聯結->MySQL 實戰->MySQL 實戰-複雜項目

組隊學習週期:(7天)

定位人羣:小白,難度係數小

每一個任務完成大概所需時間:2-3h

任務預覽(3天)

軟件安裝及服務器設置。

數據庫基礎知識

MySQL數據庫管理系統

SQL是什麼?MySQL是什麼?

查詢語句 SELECT FROM

篩選語句 WHERE

分組語句 GROUP BY

排序語句 ORDER BY

SQL註釋

SQL代碼規範

03 爬蟲

課程設計:光城、李方

組隊學習說明:

從零基礎到能獨立完成一個簡易的爬蟲項目

任務路線:請求→re→beautifulsoup→lxml→selenium→IP問題→實戰小項目

組隊學習週期:7天

定位人羣:有Python基礎。難度係數中

每一個任務完成大概所需時間:2-3h/天

任務預覽(2天)

  1. 學習get與post請求,嘗試使用requests或者是urllib用get方法向https://www.baidu.com/發出一個請求,並將其返回結果輸出。

  2. 若是是斷開了網絡,再發出申請,結果又是什麼。瞭解申請返回的狀態碼。

  3. 瞭解什麼是請求頭,如何添加請求頭。

  4. 學習什麼是正則表達式並嘗試一些正則表達式並進行匹配。

  5. 而後結合requests、re二者的內容爬取https://movie.douban.com/top250裏的內容

  6. 要求抓取名次、影片名稱、國家、導演等字段。

04 數據分析

課程設計:金娟娟

組隊學習說明:學習python for data analysis基礎知識

任務路線:python基礎-重要的python庫(numpy/pandas/matplotlib/seaborn等)-數據清洗和分析

組隊學習週期:15天

定位人羣:數據分析小白,難度係數低

每一個任務完成大概所需時間:天天平均花費時間2小時-4小時不等,根據我的學習接受能力強弱有所浮動

機器學習

01 初級算法梳理

課程設計:蘇靜、康兵兵

組隊學習說明:經過查閱書籍或參考文獻、學習視頻等,對傳統機器學習算法進行梳理

任務路線:線性迴歸--->邏輯迴歸--->決策樹

組隊學習週期:7天

定位人羣:有機率論、矩陣運算、求導、泰勒展開等基礎數學知識;難度係數低

每一個任務完成大概所需時間:2-3h

任務預覽(2天)

  1. 機器學習的一些概念

有監督、無監督、泛化能力、過擬合欠擬合(方差和誤差以及各自解決辦法)、交叉驗證

  1. 線性迴歸的原理

  2. 線性迴歸損失函數、代價函數、目標函數

  3. 優化方法(梯度降低法、牛頓法、擬牛頓法等)

  4. 線性迴歸的評估指標

  5. sklearn參數詳解

學習時長:兩天

參考:西瓜書

cs229吳恩達機器學習課程

李航統計學習

谷歌搜索

02 高級算法梳理

課程設計:黑桃,劉廣月,於鴻飛

組隊學習說明:經過查閱相關文獻,對機器學習算法進行梳理

任務路線:RF--->GBDT--->XGB

組隊學習週期:7天

定位人羣:有機率論、矩陣運算、求導、泰勒展開等基礎數學知識;難度係數中

如何申請CSDN博客:blog.csdn.net/sxhelijian/…

12分鐘教你如何使用Markdown:www.bilibili.com/video/av881…

MarkDown公式編輯:katex.org/docs/suppor…

每一個任務完成大概所需時間:2-3h

任務預覽(2天)

【參考框架】歡迎有本身的框架

  1. 集成學習概念

  2. 個體學習器概念

  3. boosting bagging

  4. 結合策略(平均法,投票法,學習法)

  5. 隨機森林思想

  6. 隨機森林的推廣

  7. 優缺點

  8. sklearn參數

  9. 應用場景

03 李宏毅機器學習(一)

課程設計:王佳旭,李威,排骨,金一鳴

組隊學習說明:經過觀看李宏毅教學視頻,團隊整理詳細筆記進行梳理算法,而且經過團隊佈置的任務理解算法(小做業,核心代碼,大做業等),徹底手寫代碼,不調包。

學習路線:迴歸,決策樹,SVM,XGBoost

學習週期:1個月

定位人羣:python基礎,數據分析,基礎數學等知識;

難度係數:高

每一個任務完成大概所需時間:天天2-4小時不等,根據我的學習能力強弱有所浮動

參考資料:

李宏毅課程教學

機器學習實戰

Datawhale整理的《學習李宏毅》筆記

04 西瓜書

課程設計:黑桃

組隊學習說明:經過學習周志華老師的《機器學習》,以博客的形式完成算法的整理

學習路線:模型評估與選擇-->線性模型-->決策樹-->神經網絡-->支持向量機-->貝葉斯分類-->集成學習-->聚類-->降維與度量學習-->特徵選擇與稀疏學習-->半監督學習-->機率圖模型-->規則學習-->強化學習

學習週期:14周

定位人羣:掌握基礎數學等知識;

難度係數:高

每一個任務完成大概所需時間:天天2-4小時不等,根據我的學習能力強弱有所浮動

參考資料:《機器學習》、《機器學習公式推導版》、cs229

05 數據挖掘

課程設計:範晶晶、李碧涵、

組隊學習說明:應用機器學習算法,完整地走完一個數據挖掘項目流程

任務路線:數據分析→特徵工程→模型構建→模型評估→模型調優→模型融合

組隊學習週期:12天

定位人羣:有Python基礎,sklearn基礎。難度係數中

每一個任務完成大概所需時間:2-3h/天

任務預覽(2天)

要求:數據切分方式 - 三七分,其中測試集30%,訓練集70%,隨機種子設置爲2018

任務1:對數據進行探索和分析。時間:2天

  1. 數據類型的分析

  2. 無關特徵刪除

  3. 數據類型轉換

  4. 缺失值處理

  5. ……以及你能想到和借鑑的數據分析處理

深度學習

01 Pytorch基礎

課程設計:許輝 李奇鋒

組隊學習說明:經過學習pytorch的基本操做,最終完成手寫數字的識別

任務路線:安裝pytorch->設立圖並計算->實現邏輯迴歸->構建多層神經網絡->PyTorch實現L1,L2正則化以及Dropout->書寫優化器代碼->用PyTorch完成手寫數字識別

學習週期:7天

定位人羣:熟悉python的基礎用法

任務完成所需時間:2-3h/天

難度係數中

任務預覽(2天)

  1. 什麼是Pytorch,爲何選擇Pytroch?

  2. Pytroch的安裝

  3. 配置Python環境

    a. 準備Python管理器

    b. 經過命令行安裝PyTorch

    c. PyTorch基礎概念

  4. 通用代碼實現流程(實現一個深度學習的代碼流程)

理論應用

01 天然語言處理(理論+實踐)

課程設計:jepson

組隊學習說明:學習天然語言處理理論,而且經過對某些數據集的文本分類任務不斷優化來進行實踐。

任務路線:特徵提取—>特徵選擇—>文本表示—>傳統機器學習算法跑模型—>LDA生成新特徵—>深度學習算法跑模型

定位人羣:有Python基礎,基本框架的基礎(例如TensorFlow、Keras和pyTorch等)!難度係數高

組隊學習週期:18天

每一個任務完成大概所需時間:3-4h

任務預覽(2天)

  1. IMDB數據集下載和探索(參考TensorFlow官方教程)

  2. THUCNews數據集下載和探索(參考博客中的數據集部分和預處理部分)

  3. 學習召回率、準確率、ROC曲線、AUC、PR曲線這些基本概念

組隊學習將從8號陸續開始報名

image

image
相關文章
相關標籤/搜索