做爲國內人工智能領軍企業,百度一直爲AI產業發展和落地提供基礎性支持,助力AI核心技術開源,落地AI應用和人才培養。算法
下載安裝命令
## CPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle
## GPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu
一直以來,百度堅持爲全國各大高校免費提供AI教學全套工具:包括AI教學平臺AI Studio,CV和NLP很多於40課時的兩套零基礎入門到實戰的系列課程教案以及實踐案例,更有Tesla V100 GPU算力卡免費贈送,爲高校師生在學習AI的道路上保駕護航。網絡
在高校中,也涌現出一批將百度AI技術應用到實際教學中的例子,今天咱們的主人公就是這樣的一位老師。框架
先帶你們認識本次課程的重量級主講老師——燕山大學馮建周副教授。機器學習
主講老師工具
馮建周 副教授 燕山大學信息科學與工程學院副教授,碩士生導師post
中國計算機學會高級會員,CCF大數據專家委員會專委學習
前後在國內外重要期刊和學術會議發表學術論文20餘篇測試
主持或參與國家天然科學基金和河北省天然科學基金項目大數據
由於疫情影響,今年馮建周老師將課程搬到了線上,依託百度AI提供的全套課程內容,在AI Studio上進行教學和實踐。優化
這門課程是《Python機器學習》,主要講授機器學習基本算法,同窗們須要進行大量線上實戰,課程中老師精心設計了六組實驗。
另外一方面,爲了延伸課程,鍛鍊學生的綜合實踐能力,老師還設計了一個三級項目環節,將AI Studio平臺中的競賽題目做爲課程三級項目。包括:問答摘要與推理、人流密度檢測、中文閱讀理解、十二種貓分類等幾個競賽題目,讓學生自由發揮,鍛鍊實操動手能力。
結課後,馮老師表示,「沒想到教學效果出乎意料的好,AI Studio平臺不只提供了咱們最須要的計算資源,還提供了豐富的實驗案例,內置項目和視頻功能,更是極大的減小了咱們準備教案、備課的時間,不只讓學生能夠自主學習,咱們也能在後臺看到學生的學習狀態,對平常教學起到很大的幫助做用。」
老師如此盛讚,小編已經很是好奇了,一塊兒來看看百度飛槳究竟爲同窗們帶來了哪些成長和變化呢?
01 深度學習新人的飛槳常規賽之旅
——Halation同窗
小組參加的是《常規賽:問答摘要與推理》,比賽主題爲汽車大師的問答摘要與推理。做爲深度學習剛剛入門不到三個月的新人,小組成員在初次看到比賽題目時,感受無從下手。
通過老師指點,以及遍查資料後,他們決定先從文本摘要和文本推理兩個方面入手,但訓練後的結果不盡如人意,準確率下降。
網絡結構示意
通過分析,成員們將緣由鎖定在網絡模型不適合。若是可以人爲剔除更多的對於摘要可有可無的單詞,也許能夠達到更好的效果。
Halation同窗說:「在機器學習入門的過程當中,咱們發現AI Studio平臺中有着豐富的數據集資源和各類經典的實踐案例,這無疑成爲咱們學習的寶庫。另外一方面,咱們也從平臺的衆多開源項目中學習到了更多關於機器學習,尤爲是深度學習方面的知識。感謝百度飛槳和AI Studio平臺,經過學習,咱們小組也對飛槳框架有了更多的瞭解,對深度學習的許多模型也有了更深的認識。咱們但願在從此的學習中,更加深刻了解深度學習中的模型結構,掌握模型的底層原理,最後遊刃有餘地運用網絡模型,解決更多的實際問題。」
經過訓練找到進步的地方,同窗們的成長棒棒噠,少年們將來可期~
項目連接:
https://aistudio.baidu.com/aistudio/projectdetail/383197
02 飛槳教你作人流密度估計
——隔壁老常同窗
近年來,行人分析視覺技術在居家、安防、新零售等多個重要領域普遍應用。
項目要求參賽者給出一個算法或模型,對於給定的圖片,統計圖片中的總人數。給定圖片數據,選手據此訓練模型,爲每張測試數據預測出最準確的人數。
最終兩模型各訓練90000batch後結果以下:
通過討論,同窗們總結了兩點改進意見:
一、對libs.post_process後處理中的參數進行優化;
二、預測忽略區域,在測試時填充黑色。
在不斷的練習中覆盤,同窗們努力尋求更優解,百度飛槳見證了同窗們一點一滴的進步和成長。
項目連接:
https://aistudio.baidu.com/aistudio/projectdetail/475632
03 飛槳幫你作中文閱讀理解
—— day我不dead同窗
說起閱讀理解,咱們的第一印象就是中學的時候英語試卷中的閱讀理解,與之相似,機器閱讀理解,其實就是讓機器學會閱讀文檔,並能從中找出正確答案。
剛拿到這個題目時,團隊成員的大腦幾乎一片空白。腦中不斷涌現出各類問題:如何將文本轉換爲數值型數據?RNN仍是CNN?網絡結構應該如何配置?用什麼模型訓練能夠取得好的結果等等。
通過努力,他們最終利用DuReader數據集的Baseline,解決了上述的全部問題。
day我不dead同窗說:「感謝飛槳給咱們提供了一個提升本身,鍛鍊本身的平臺,給咱們提供了許多NLP領域優質的免費資源,還有許多優秀項目可供借鑑,而且免費的GPU真的很良心、很好用!祝飛槳愈來愈好!」
項目連接????:
https://aistudio.baidu.com/aistudio/projectdetail/475972
04 貓十二分類-飛槳圖像分類幫我雲擼貓
——君匡同窗
工做太累,看一些貓貓的圖片或者是短視頻,纔有繼續努力的動力呢!雲擼貓是如今很大一部分愛貓人士緩解壓力的方法。
可是,兩隻小貓好像啊,會不會是同一種貓貓呢?
本次研究使用的數據來源於百度官方提供的貓臉識別-12種貓分類數據集,包含有12種貓咪的圖片,共2160張貓咪圖像,每一類均有180張左右的照片。
小組成員運用百度飛槳深度學習框架,構建了以ResNet101爲骨架的深度神經網絡的貓咪圖像分類模型,對貓咪的圖像進行分類和目標識別。
通過實驗和分析,實現了對貓咪進行圖像分類,單目標貓咪分類準確率爲94%,說明基於飛槳框架的圖像分類具備較好的準確率。
若是之後雲擼貓,這個項目就能讓你更輕鬆的判斷可愛的貓貓究竟屬於哪一個類別啦~
項目連接????:
https://aistudio.baidu.com/aistudio/projectdetail/474305
05 利用飛槳實現文本摘要總結
——舍卟得放卟下灬同窗
這個項目主要是飛槳平臺進行文本摘要生成,運用Word2Vec和TextRank算法來對文本進行摘要生成。
小組同窗們須要在AI Studio中使用所提供的訓練集(82943條記錄)創建模型,基於汽車品牌、車系、問題內容與問答對話的文本,輸出建議報告文本。
來看看同窗們是如何實踐的?
舍卟得放卟下灬同窗說:「通過了此次實踐,對NLP的瞭解更深刻了,有些遺憾的是此次沒有使用到Seq2Seq模型這個大殺器,若是使用的話,效果可能會更好。」
不用遺憾,意識到問題自己就是最大的成長,相信同窗在飛槳平臺上不斷訓練後,必定會有更多的收穫與成長~
項目連接:
https://aistudio.baidu.com/aistudio/projectdetail/474553
06 基於飛槳進行中文新聞標題分類
——彩虹的男人20同窗
網絡新聞正在成爲人們獲取新聞的主要途徑,如何對冗雜的新聞進行分類,無疑是一個急需解決的問題!
基於此,同窗們將在飛槳平臺上採用BiLSTM模型,對THUCNews 數據集進行中文新聞文本標題分類。
最後,同窗們在七個方面對模型進行優化,將準確率提升到了93%,較其餘使用同等模型的項目效果有所優化。
彩虹的男人20同窗說:「首先真的特別感謝百度提供的飛槳平臺,不只爲咱們提供了易於上手操做的項目基礎,並且在項目執行時提供了免費的GPU算力卡,爲咱們進行項目優化留出更多的時間。咱們會繼續使用百度飛槳平臺來學習使用bert+fc來優化此新聞文本分類項目。」
項目連接:
https://aistudio.baidu.com/aistudio/projectdetail/399250
看完同窗們的這些做業,小編不由暗自感嘆:同窗們都太優秀了!
水滴石穿,非一日之功。在百度AI強有力的幫助下,同窗們經過項目不斷總結反思,提煉技術,能力廣泛得到提高、進步,完成了從AI小白到進階選手的蛻變。
馮老師表示,「百度飛槳不只鍛鍊了學生的綜合實踐能力,也培養了不少同窗對人工智能的濃郁興趣,他們在項目結束後,並無中止下來,而是紛紛報名參加了平臺上的多個AI競賽,走上實踐創新的道路。」
種一棵樹最好是在10年前,其次是如今。期待更多高校、機構分享本身的教學成果,一塊兒創造更好的課程,持續創新,取得勝利!在飛槳平臺的支持下,共同助力AI人才發展,期待將來能與更多優秀老師、同窗在飛槳相遇!
下載安裝命令
## CPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle
## GPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu