AI數據標註行業面臨的5大發展困局丨曼孚科技

根據艾瑞諮詢發佈的行業白皮書顯示,2018年中國人工智能基礎數據服務市場規模爲25.86億元,預計2025年市場規模將突破113億元,行業年複合增加率達到了23.5%。​安全

做爲人工智能產業的基石,數據標註行業正在從幕後走向前臺,將來前景無限廣闊。服務器

然而,正如黎明前是一片無盡的黑暗同樣,數據標註行業在蓬勃發展的背後也面臨着諸多困局,這些困局已成爲阻礙行業發展最大的絆腳石。機器學習

1. 人力成本突出ide

數據標註雖然披着人工智能的「外衣」,可是本質上仍然屬於勞動密集型產業。工具

目前,國內從事數據標註行業的人羣已達上千萬,這其中90%的從業人員爲數據標註員,這些數據標註員分散在大大小小的標註團隊內。學習

以一個20人全職的小標註團隊爲例,平均天天每一個人的人力成本大約在100-200元,每月僅僅在人力成本上的消耗就達到了6萬-12萬,而一個週期在半個月以上的標註項目可能總合同金額不過幾萬元而已,這樣的結果就是不少標註團隊營利甚微或是壓根就沒法營利。人工智能

事實上,不少標註團隊的管理人員已經意識到人力成本對於團隊發展的威脅,可是卻不多有人選擇以裁人的方式來減小此類成本,甚至不少團隊頂着虧損的風險不斷加人,緣由無他,做爲勞動密集型產業的數據標註行業,有足夠的人力才能保證吃得下大項目,越是裁人越是沒法接到高利潤的大項目,拾人牙慧撿一些小資源,團隊最終面臨的可能就是解散的局面。blog

2. 標註效率低下資源

在人力成本沒法大規模減輕的局面下,擺在數據標註團隊面前最可行的方式就是提升標註效率。部署

經過招聘熟練度較高的數據標註員,或是使用高效率的標註工具能夠作到在短期內有效提高標註效率,可是到了真正實施的階段,不少人卻發現並非如此簡單。

一方面,熟練度較高的高素質數據標註員在行業內還是稀缺狀態,尤爲是隨着AI公司對於標註數據的場景化需求愈來愈高,這種缺口將愈來愈大。舉個簡單的例子,在語音標註領域,目前有不少英文標註項目,可是熟練掌握英語的數據標註員卻稀少。

另外一方面,行業內缺少一款高效率的數據標註工具。目前不少標註團隊使用的是開源標註工具,此類工具雖然可以知足基本的標註需求,可是在效率、準確度上已經遠遠知足不了當下AI公司的需求。

AI數據標註行業面臨的5大發展困局丨曼孚科技

3. 準確率難以知足AI公司需求

人工智能行業內有一個簡單但很重要的共識:數據集質量的高低直接決定最終模型質量的好壞。

機器學習依賴海量標註數據的投喂,這些數據質量的高低將對AI最終可否順利落地產生關鍵性影響。

目前不少AI企業都意識到了這點,並在標註數據質量上提出了新的要求。舉個例子,以往標註數據的準確率達到了95%便可知足AI企業的需求,可是目前就需求達到99%,甚至是99.99%。

然而,目前至關多的標註企業沒法知足這樣的需求,緣由正如上面所說,一方面數據標註員能力良莠不齊,另外一方面標註工具質量低下。

4. 數據安全性存疑

數據標註行業既然與「數據」有關,那麼安全性必定是不少企業關注的重點。

在安防領域,由於涉及到須要採集標註不少人臉等私密數據,所以確保數據的安全性成爲了不少項目方的硬性需求。

從數據的採集、數據的標註,再到數據的保存,每個環節都必須保證數據不被泄露、不被竊取,這對於不少團隊來講都是沒法作到的事情。

一方面,不少團隊沒有本身獨立研發的標註平臺,仍使用開源工具或者是在開源工具的基礎上略做修改,使用這種開放的平臺如何保證數據的安全性?

另外,不少企業在標註與儲存數據的過程當中,出於成本的因素使用的仍然是公有服務器,這對於許多安防領域的企業來講,很明顯是沒法達標的。

5. 欠缺場景化標註能力

隨着人工智能技術開始大範圍落地應用,AI公司對於標註數據的場景化要求正變得愈來愈高。

以汽車自動駕駛爲例,相關汽車廠商對於標註場景要求愈來愈精細化,一些複雜的長尾場景諸如闖紅燈車輛、橫穿馬路的行人、路邊違章停靠的車輛等等出現的頻率開始增多,至關多數據標註團隊沒法知足AI企業相似的標註需求。

AI數據標註行業面臨的5大發展困局丨曼孚科技
汽車自動駕駛標註場景(來源:曼孚科技數據標註平臺)

這一方面與數據標註團隊欠缺定製化服務能力有關,另外一方面也與標註團隊使用的標註工具功能簡單化有關。在AI大規模落地的時代背景下,沒法知足項目方的需求即意味着面臨被淘汰的風險,提高場景化、定製化標註能力是擺在不少標註團隊面前至關現實的需求。

針對以上困局,曼孚科技從現實出發,作出了以下的努力:

  1. 專業團隊打造優質數據服務平臺,服務成本下降30%以上;

  2. 獨立自研SaaS數據標註平臺,預標註技術加持下標註效率可提高4倍以上;

  3. 實時精確估算與AI輔助篩查,數據精確至99%以上;

  4. 支持私有云部署,實時監測增強安全保護;

  5. 定製化場景搭建,7X24小時快速技術響應。

經過以上努力,曼孚科技致力於爲客戶提供高水準、高效率、定製化、場景化的數據標註服務體驗。曼孚科技旗下的數據採集標註一站式解決方案平臺正在自動駕駛、安防、VR/AR、無人機、新零售、AI教育、工業機器人等相關領域悄然改變着這個世界。

儘管當下數據標註行業面臨的困局已經影響了總體產業的蓬勃發展,但正如曼孚科技的願景同樣,咱們將憑藉自身努力,用數據解放AI的一切可能。

相關文章
相關標籤/搜索