今年COMPUTEX活動上,魁達智慧(creDa)展出了今年1月正式上線的動態影像標記平臺「ezLabel」,只要上傳影片至平臺,並針對目標對象第一次、最後一次出現的畫面進行標註,就能透過算法自動標記出影片中的目標對象,能夠比傳統標記方式快15倍。而在4月9號改版後,除了接口中可支持的對象標記新增到1026種,也加入了標記行爲的功能,可針對同一區段的多種行爲重複標記。通常在標記動態影像時,會須要在一幀一幀的靜態畫面中標出目標對象,若以一秒24幀來算,每十幀標記一次,在一秒內就須要標記2-3次,時常耗費大量時間來標記影像。爲了縮短標註時間,魁達推出ezLabel動態影像標記平臺,用戶只需上傳影片至平臺,先行用方框框出目標物第一次、最後一次出如今畫面中的位置,再點擊執行,系統就會透過深度學習提取畫面特徵值並與影片比對,再自動標出目標對象。算法
今年4月9號改版後ezLabel新增了標記行爲的功能,沈柏均表示,許多開源軟件提供標記行爲的方式,是用單張靜態畫面去標註,但行爲應該是連續性的動做。所以,ezLabel讓用戶在區段中標記行爲,例如「走路」這個行爲,能夠用十幀畫面中、被標註的人的動做變化來定義。此外,在區段中也可重複標記不一樣的行爲,例如一我的一邊走路一邊撐傘,就能在區段中同時標記「走路」與「撐傘」的行爲。ezLabel註冊帳號後就可使用,學生用戶比例較高,在標記完成後,ezLabel也提供兩種常見的下載格式,分別是PASCAL VOC、JSON,能直接用於AI模型的訓練。將來,魁達也但願能將標記完的數據直接串接雲端,能讓用戶能更便利運用數據來訓練模型,省去數據被下載、再上傳雲端的程序。內文來源至:www.ai.org.tw/map.asp學習