AI抗蟲記,百度飛槳打造蟲害「剋星」

三七,盛產於雲南,有化瘀止血,活血定痛的功效,民間將其與人蔘並稱之爲「北參南七」。算法

 

但不爲大衆所知的是,三七真正與人蔘一塊兒成爲藥材的兩座高峯,在悠悠長河通常的中醫史中並不算久遠。它的藥用價值最先被雲南地區的少數民族發現,直到明代也只被當作西南軍隊中的金瘡藥。編程

 

( 圖:三七藥材)小程序

 

三七真正被普遍使用,一種說法是起源於被收錄到《本草綱目》之中。相傳,李時珍曾於藥材市場中偶遇一雲南藥商,見其兜售本身從未見過的三七,便上前請教。架構

 

藥商傾囊相授後,李時珍有意將其買下,但隨身錢財盡數而出卻依然不足。最後,藥商得知面前人的真實身份後,決定將三七做爲初交之禮,這纔有了往後的「金不換」。框架

 

藥商與李時珍的偶遇,使三七成爲世人的福音提早不知數年;機緣巧合,在四百多年以後,另外一位年輕人更由於三七之藥效,走上了人生的興趣之路。機器學習

 

01 穿越深山去看三七性能

 

這位年輕人叫徐國秦,她與三七結緣於雲南文山。學習

 

徐國秦是土生土長的昆明人,但對於三七,若非生病,也不會接觸到。徐家有遺傳的頭疼病,這種遺傳在徐國秦高中學習壓力最大的時候顯現出來了。爲了治頭痛,中醫建議徐國秦吃三七粉。人工智能

 

還記得當時醫生告訴她,給她開的三七就是產自文山。spa

 

雖然是有名的三七產地,但現在很多農戶已經放棄了文山這個地方,由於種植過三七的土地,可能十年都不能再種植三七。

 

(圖:三七山林與種植棚環境)

 

苛刻的生存條件與漫長的生長週期,使得三七這味中藥變得價格高昂。

 

「當時花了五百多吧,研磨成粉後只有一點點。」 

 

三七治好了徐國秦的頭痛,同時也爲徐國秦打開了一扇通往中藥世界的大門。

 

經過百度搜索資料,徐國秦初步瞭解到了三七生長困難及病蟲害氾濫的事,但她沒料到幾年後,在大學裏,本身還有機會再次深刻接觸三七。

 

2019年炎夏,正值徐國秦經過2019中國高校計算機大賽人工智能創意賽初賽,進擊複賽的時期。她初賽時提出的創意構思就是運用人工智能去達到早期防治三七病蟲害的目的。

 

爲了收集更多三七病蟲害的數據及圖片,徐國秦屢次前往三七種植基地。

 

(圖:徐國秦採集數據)

 

提及實地採集數據時的困難,徐國秦自嘲地表示「曬黑了」,但她憑着手機裏近兩千張三七病蟲害圖片,儼然成了半個三七「專家」。

 

(圖:徐國秦採集數據)

 

但山裏轉了幾次下來,徐國秦更多的感覺是「心疼」。

 

對於不少種植戶來講,三七是家裏主要的經濟來源,若是一旦發生大面積的病蟲害,這就意味着幾年來的心血付之東流。

 

種植基地的負責人帶徐國秦去看地裏遭受病蟲害侵襲的地方,那裏大片植株枯死發黃,曾有人虧損上千萬,這對於全部種植戶來講都是巨大的打擊。

 

「我出身農村,很是清楚他們對於所種做物的感情,因此很想作點什麼幫到他們。」

 

在昆明晉寧三七種植基地,徐國秦發現600畝的三七地,只有20個左右的工人,他們要對漫山遍野的三七進行一一檢查,記錄,排除病蟲害,發現病蟲害後,又配相對應的藥水進行人工噴灑。

 

人工檢查預防病蟲害,效率低下,成本也高,若是能借助人工智能對病蟲害進行實時監測,那三七種植興許能迎來更光明的將來。

 

02 跨過專業鴻溝建模

 

徐國秦是主修計算機科學與技術的,但她對於編程及人工智能的瞭解微乎其微,並不是她沒認真學。

 

「我雖然是計算機專業,但我是師範類的計算機,因此和非師範類的計算機專業學生其實相差很大,咱們沒有人工智能相關的課,對編程要求也低。」

 

缺少專業知識,這也使得徐國秦在參加比賽之初,處於一種很是不自信的狀態。

 

這種不自信還由於本身是單打獨鬥,接到比賽初賽報名單時,已經臨近期末,你們忙着準備四六級或期末考試,無意參加這種比賽,雖然老師建議三人組隊參加比較好,但一時找不到隊友的徐國秦只好以我的名義參賽。

 

不管徐國秦如何努力,如何想作點「成績」,對於一個沒有算法基礎的學生來講,要創建一個專業的模型是很是難的。

 

「在比賽以前,我根本不知道EasyDL是什麼,爲了保險起見,拿到操做手冊時還花了三天時間來看。」

 

隨着機器學習,尤爲是深度學習在複雜數據上的表現越發優秀,不少開發者試圖將其應用到自家產品中。然而,即便是使用預訓練模型或開源框架,於不太瞭解機器學習算法工程的開發者而言依然是巨大挑戰。

 

EasyDL是基於百度飛槳的定製化AI訓練和服務平臺,面向各行業有定製AI需求的企業及開發者,提供從數據管理與標註、模型訓練、服務部署的一站式AI開發全流程支持。

 

EasyDL的目標,其實就是讓零算法基礎的用戶,也能夠基於自身業務需求和數據,快速訓練專屬的定製化AI模型。

 

其實,那個相似「說明書」的東西,只須要花一天就能掌握,這也是EasyDL對於零基礎人士的友好之處。

 

EasyDL爲徐國秦免去了算法的過程,只須要上傳數據圖片,而後就能獲得一個模型或接口。聽起來是否是很是簡單,但收集數據及訓練模型倒是要付出巨大耐心和努力的。

 

徐國秦第一次從三七基地採集數據回來後,模型的精度最高只有80%,雖而後續她不斷往模型裏填數據,進行各類調整,精度不升反降。

 

「當時真的很苦惱,不知道爲何。」

 

好在百度EasyDL的技術人員告訴徐國秦,她之因此費了那麼多勁,精度還不升反降的緣由是,她植入的數據並不平衡,簡而言之,不一樣種類病蟲害的數據數量不一,有的多,有的少。

 

爲了達到數據的平衡,徐國秦又前往基地進行了數據採集……

 

「如今的模型,識別精度已經達到了93%。」

 

雖然精度達到了,但模型離完善還很是遠,因爲三七各種病蟲害並不是都產生於同一季節,有的常見,有的罕見,因此徐國秦創建的模型,因爲短期內數據有限,目前也只能識別7種常見的三七植株病蟲害。

 

可這些成果對徐國秦來講已經很是不易。

 

不一樣於專業團隊,若是機器學習不是產品的核心技術,額外維護機器學習算法團隊的成本又很是高,即便不考慮工程化的問題,將機器學習模型部署到客戶端也有很是大的成本。

 

不少時候,普通人可能更須要一種能快速使用高性能深度學習的方法。

 

EasyDL的存在,使得很多步驟都自動化,普通人可以徹底越過算法,只須要收集數據,而後上傳標註,再選擇合適的模型與參數進行訓練,EasyDL訓練完成的模型能夠在平臺上直接申請發佈,得到API雲服務和離線SDK安裝包兩種形式的產品,也能夠支持直接發佈成H5 demo。

 

整個過程都不會涉及到複雜的算法與工程方面的問題,對於像徐國秦這樣缺少基礎的人來講,很是合適,只要藉助這樣一個平臺就能實現AI的「定製」。

 

目前EasyDL的各項定製能力在業內已經獲得普遍應用,在零售、安防、互聯網內容審覈、工業質檢等二十多個行業都有應用落地,並提高了這些行業的智能化水平及生產效率。

 

03 這是人生的API/SDK

 

通過對模型的辛苦訓練,「三七早期病蟲害檢測」項目已經初具模型,決賽近在眼前,但仍有一個問題須要思考。

 

(圖:三七病蟲害模型訓練識別結果)

 

畢竟專業人士可以經過肉眼識別相關病蟲害,雖然模型已經可以識別三七常見的病蟲害,可是便捷性和實操性上依然差不少。

 

在三七園中安裝上攝像頭,攝像頭鏈接基於EasyDL的API,動態監測三七的生長狀況,隨時隨地反饋發生病蟲害的植株,徐國秦的項目纔算是真正落地。

 

決賽結束,徐國秦得到了2000元的獎金,她把這筆獎金稱爲本身除了獎學金之外的「第一桶金」。

 

既然這樣的模型可以檢測三七病蟲害,是否意味着對其餘中草藥也能適用?好比重樓,再好比天麻……這是否意味着EasyDL將承擔起更多的社會責任?

 

「我好像知道本身接下來要作什麼了。」

 

「經過這個項目,我對人工智能和編程都產生了史無前例的興趣。」

 

在衆多經過百度走進AI世界的人中,徐國秦是最普通的一個,也是最具備表明性的年輕人之一,若是不是2019中國高校計算機大賽人工智能創意賽,零算法基礎的她可能很難有機會去深刻了解AI。

 

(圖:中國高校計算機大賽人工智能創意賽參賽選手現場演示各類「硬核」設備)

 

一個爲零基礎人士誕生的EasyDL,不只讓徐國秦初步實現了本身幫助三七種植戶的願望,還激發了本身對人工智能的興趣。

 

事實上,爲三七防治病蟲害只是百度AI賦能各行各業中一個很小的例子。經過中國高校計算機大賽人工智能創意賽的選手做品,咱們能看到學生們將百度AI技術能力應用於各行各業——好比中南大學團隊用百度飛槳開發了基於臨牀圖像和病史數據的皮膚疾病全病種分類系統,以小程序爲載體,操做簡單零門檻,診斷專業,解決了看病難的問題,對智慧醫療有很是重要的意義;北京郵電大學團隊開發的基於百度飛槳的視覺輔助智能眼鏡系統,幫助視力障礙人士完成「平常行走」、「尋找物體」基本生活需求,使其成爲盲人的第二雙「眼睛」;浙江工業大學團隊使用EasyDL提供的圖像分類模型,作出了超市智能補貨機器人,大幅下降了無人超市的運營成本,讓工做人員今後告別夜間補貨……

 

除了幫助學生的「腦洞」落地,百度大腦AI開放平臺也已經普遍應用於農業、工業、醫療、零售等各項產業智能化升級中;又如AI尋人,經過人臉比對技術,實現了家庭的團聚。截止到今年6月,百度AI尋人已經幫助6700個家庭團圓。除此以外,還有AI助盲行動、AI助老兵圓夢等等這些案例。

 

衆所周知,越是須要專業的技術,則意味着越容易出現人才荒。按照國內教育部門的測算,國內AI人才的供求比例爲1:10,缺口超過500萬。

 

面對人才短板的棘手問題,很多高校聞風而動,已經有70餘所國內院校開設人工智能相關專業,卻也頻頻出現對現有模式的質疑。

 

做爲中國人工智能領域的佈道者,百度也開闢出了本身的人才培養之路。

 

一方面,百度經過與各級政府部門、各大高校聯合舉辦各項AI競賽,提供飛槳深度學習框架平臺、EasyDL定製化訓練服務平臺、AI Studio平臺,先進的技術、導師指導、資金支持,賦能高校人工智能人才教育,幫助學生快速成長爲研究能力和實踐能力兼具的複合型人才。

 

另外一方面,針對AI教師稀缺、原理與實踐不協調的問題,百度在全國開展深度學習師資培訓班,培養超過1000名高校一線教師。同時參與編撰《深度學習導論與應用實踐》等人工智能教材,上線了多門基於飛槳的免費精品課……

 

中國社會科學院社會學研究所2018年末發佈的《2018百度社會價值報告》顯示,百度已經爲整個業界培養了近55萬名人工智能相關人才,極大激活了當下匱乏的AI人才市場。

 

百度聯合深度學習技術及應用國家工程實驗室等機構發佈的《深度學習工程師能力評估標準》,彌補了國內深度學習工程師認證考試方案和體系化的深度學習人才培養方案的空白。並基於此標準,針對不一樣層級從業者開展零基礎深度學習集訓營、PaddleCamp將來深度學習工程師集訓營、AI快車道-企業深度學習實戰營、黃埔學院-首席AI架構師培養計劃,爲企業從業人員提供更專業的學習平臺,幫助企業培養AI技術人才,從而總體推動AI人才的培養。

 

這樣的願景正合李彥宏爲百度提出的「Everyone can AI」的理想。

 

百度大腦AI開放平臺上的技術能力或許只是最後爲你提供一個API或離線SDK,但對於諸多像徐國秦這樣有想法的人來講,人生的一切纔剛剛開始,對於整個百度的人工智能藍圖來講,將來更加可期。

>> 訪問 PaddlePaddle 官網,瞭解更多相關內容

相關文章
相關標籤/搜索