當機器學習碰見「衆包」——訪微軟雷德蒙研究院首席研究員周登勇

提到衆包,想必大多數人都不陌生,「一個公司或機構把過去由員工執行的工做任務,以自由自願的形式外包給非特定的(並且一般是大型的)大衆網絡的作法。衆包的任務一般由我的來承擔,但若是涉及到須要多人協做完成的任務,也有可能以依靠開源的個體生產的形式出現。」這一律念由美國《連線》雜誌的記者傑夫·豪(Jeff Howe)在 2006 年 6 月提出,衆包模式的出現極大的提高了企業工做效率並且大幅下降成本。數據庫

人工智能時代即未來臨,做爲實現人工智能的重要方法,機器學習開始受到普遍關注。訓練機器學習系統須要大量的帶標籤數據,實現諸如語音識別及圖片分類等功能,好比將帶有花朵的圖片與「花朵」這個詞語捆綁起來。傳統基於專家的數據標記緩慢而昂貴,基於此,機器學習開始與衆包模式相融合,後者成爲了當今獲取標記數據的基本手段。網絡

儘管聽起來很是簡單,但如何利用衆包打造機器學習的高品質數據庫遠不是一件簡單的事情。衆包背後涉及哪些技術?怎樣保證數據精準?帶着這些問題,咱們採訪了美國微軟雷德蒙研究院首席研究員周登勇博士,就衆包與機器學習融合中的一些問題進行了請教。機器學習

點擊查看原文學習

相關文章
相關標籤/搜索