AI訓練用影片又有新方法!標記平臺「ezLabel」比傳統流程快15倍

今年COMPUTEX活動上,魁達智慧(creDa)展出了今年1月正式上線的動態影像標記平臺「ezLabel」,只要上傳影片至平臺,並針對目標對象第一次、最後一次出現的畫面進行標註,就能透過算法自動標記出影片中的目標對象,能夠比傳統標記方式快15倍。而在4月9號改版後,除了接口中可支持的對象標記新增到1026種,也加入了標記行爲的功能,可針對同一區段的多種行爲重複標記。通常在標記動態影像時,會須要在一幀一幀的靜態畫面中標出目標對象,若以一秒24幀來算,每十幀標記一次,在一秒內就須要標記2-3次,時常耗費大量時間來標記影像。爲了縮短標註時間,魁達推出ezLabel動態影像標記平臺,用戶只需上傳影片至平臺,先行用方框框出目標物第一次、最後一次出如今畫面中的位置,再點擊執行,系統就會透過深度學習提取畫面特徵值並與影片比對,再自動標出目標對象。算法

雖然平臺沒有限制影片上傳長度,但魁達智慧執行長沈柏均也提醒,影像在平臺上播放與標記時,會佔用我的計算機的暫存內存,內存要夠大才能處理更長時間的影像,所以會建議影片長度以五分鐘爲限。沈柏均也表示,現行的算法仍沒法適用於全部對象的標記。經開發團隊測試後,肯定可被自動化標記的對象共有1026項,包括常見的汽機車、行人,或是水中生物等,均已內建於平臺接口中,但若是用戶在接口中找不到欲標註的對象,能夠利用自定義的功能新增項目來測試,仍然可能適用於自動化標註。「全自動的算法沒有到完美,但是能夠比過去快15倍。」沈柏均表示,可否被自動標註也取決於影像的複雜度,例如在大量機車停等紅燈的場景中,目標機車就不容易被辨識,所以,在系統自動化標註完成後,須要人工複查,從新將錯誤標記的部份更正,但即使如此,整個標記流程仍是能比傳統方式快15倍。

ezLabel平臺提供用戶自行建立任務的功能,並能夠選擇欲標記物項的種類(Category)、型式(Type)、特徵(Attribute)。

若接口中找不到欲標註的對象,能夠利用自定義的功能新增項目來測試。

接下來就能夠在影片的畫面中標記出目標物,再透過算法自動標註。

今年4月9號改版後ezLabel新增了標記行爲的功能,沈柏均表示,許多開源軟件提供標記行爲的方式,是用單張靜態畫面去標註,但行爲應該是連續性的動做。所以,ezLabel讓用戶在區段中標記行爲,例如「走路」這個行爲,能夠用十幀畫面中、被標註的人的動做變化來定義。此外,在區段中也可重複標記不一樣的行爲,例如一我的一邊走路一邊撐傘,就能在區段中同時標記「走路」與「撐傘」的行爲。ezLabel註冊帳號後就可使用,學生用戶比例較高,在標記完成後,ezLabel也提供兩種常見的下載格式,分別是PASCAL VOC、JSON,能直接用於AI模型的訓練。將來,魁達也但願能將標記完的數據直接串接雲端,能讓用戶能更便利運用數據來訓練模型,省去數據被下載、再上傳雲端的程序。內文來源至:www.ai.org.tw/map.asp學習

相關文章
相關標籤/搜索