2019年,國內人工智能領域的投融資熱情大幅下降,至關數量的AI企業完全消失在了歷史的長河中,「人工智能寒潮已至」甚至成爲行業年度熱詞。算法
與前幾年創業與投資熱情齊頭並進的盛況相比,近段時間的AI行業顯然蕭條了不少。安全
究其緣由,「AI落地難」要負主要責任。ide
從自動化時代到智能化時代,人工智能創造的價值在不斷增加。與此同時,業務場景的精細度與複雜度也在不斷提高,爲人工智能技術的落地帶來一系列挑戰。工具
以國內人工智能企業爲例。目前國內幾個較大的人工智能獨角獸企業,商業化落地主要集中在金融、安防監控、手機移動互聯網三個領域,而其餘領域則表現平平。人工智能
細化到具體業務場景中,汽車自動駕駛是AI最重要的商業化落地領域,相關人工智能企業在無人駕駛/自動駕駛投入巨大,但距離大規模商業化應用依然十分遙遠。blog
目前自動駕駛的主要應用場景無非就是路測一下、會展展現一下、無人駕駛園區試駕一下,但這些顯然沒法爲一家以營利爲目的的企業帶來任何實質性的收入。圖片
汽車自動駕駛距離大規模商用仍有一段距離
企業的長久健康生存須要盈利,AI企業一樣不例外。擺在一衆AI企業面前最爲迫切的現實需求就是,如何破局「AI落地難」的困境。部署
古語有云「解鈴還須繫鈴人」,破局AI落地難的關鍵,是找到何種因素致使了這種結果。it
在人工智能領域,算法、算力與數據是構成行業的3大重要基礎要素。長久以來, AI企業關注的重點主要集中於算法與算力領域,對於數據領域的關注度則廣泛較低。自動化
事實上,做爲人工智能行業的基礎,數據在AI落地的過程當中所扮演的角色顯然被忽視了。要把人工智能應用到具體的業務場景中,首先須要解決數據獲取和數據治理等相關問題,具體到行業中就是數據標註行業需率先變革。
一張通過數據標註後的圖片(圖片來源:曼孚科技數據標註平臺)
人工智能行業內有一個簡單但很重要的共識:
數據集質量的高低直接決定最終模型質量的好壞。
在人工智能行業興起初期,行業關注的重點主要集中於理論與技術自己,此時一種前沿的技術概念都有可能爲企業帶來規模龐大的外部投資。
可是,到了技術相對成熟期,投資人與AI企業關注的重點就轉向了技術的商業化落地,畢竟企業與投資人最爲看重的仍是盈利。
然而,理論與實踐的結合老是不那麼一路順風。AI企業在商業化落地的過程當中,發現了一個很棘手的問題:標註數據集的質量能夠知足實驗室的基本需求,但卻沒法支撐起AI落地的發展洪流。
咱們以實例爲證:
在人臉識別等單點場景,涉及到的數據類型通常比較簡單。但在更完整的業務場景中,數據就會變得更加複雜起來;
工業場景中,會涉及到工業現場圖像數據、工藝流程文本數據和設備運行的時序數據等更加精細化數據的標註;
醫療場景中,對醫療影像和文本的標註,須要具有醫學專業知識的人員進行……
以往在實驗室裏僅需少許且質量尚可的數據集便可知足基本實驗的需求,可是到了具體化的商業落地場景中,現實給標註數據集提出了諸多新的要求:
海量、高質量、場景化、定製化、智能化……
高質量標註數據集才能撐起人工智能行業的將來(圖片來源:曼孚科技數據標註平臺)
在這樣的新形勢下,破局AI落地難的關鍵,就在於數據標註行業的率先變革。
做爲人工智能行業的基礎,數據標註行業長期處於刀耕火種的粗放狀態中,披着人工智能的外衣,可是本質上仍然屬於勞動密集型產業。
在AI商業化落地的大潮下,數據標註行業不該拖了行業發展的後腿,而應該主動爲人工智能行業的發展保駕護航。
以曼孚科技數據標註服務爲例,一方面經過培訓專業標註團隊與提供定製化服務,來解決數據採集、數據標註的質量問題;另外一方面,經過自研SaaS數據標註服務平臺與自動化的輔助工具,來解決數據標註的效率問題,具體的努力以下:
專業團隊打造優質數據服務平臺,服務成本下降30%以上;
獨立自研SaaS數據標註平臺,預標註技術加持下標註效率可提高4倍以上;
實時精確估算與AI輔助篩查,數據精確至99%以上;
支持私有云部署,實時監測增強安全保護;
經過以上努力,曼孚科技但願從新構建起人工智能行業發展的基石,用高質量的標註數據集破局「AI落地難」的困境,爲相關人工智能企業的商業化落地之路掃清障礙。
目前,曼孚科技的標註數據集正大規模應用於自動駕駛、安防、VR/AR、無人機、新零售、AI教育、工業機器人等相關領域,曼孚科技指望用高質量的數據撐起人工智能行業新的將來!