在外界人眼中,達摩院人才輩出,大可能是奇人異士,作着神祕且高端的研究,有如掃地僧通常的存在,可是若是有一天,當神祕專家再也不神祕,你發現他們也開始玩摳圖,且這一切都朝着不受控制的方向發展了的時候,那麼摳圖他們能玩出哪些花樣?html
視頻連接:https://ucc-vod.alicdn.com/sv...git
這要從阿里巴巴智能設計實驗室自主研發的一款設計產品鹿班提及。鹿班的初衷是改變傳統的設計模式,使其在短期內完成大量banner圖、海報圖和會場圖的設計,提升工做效率。商家上傳的寶貝圖良莠不齊,直接投放效果不佳,經過鹿班製圖能夠保證會場風格統1、高質視覺效果傳達,從而提高商品吸引力和買家視覺體驗,達到提高商品轉化率的目的。web
而在製圖的過程當中,咱們發現商品摳圖是一項不可避免且繁瑣的工做,一張人像精細摳圖平均須要耗費設計師2h以上的時間,這樣無需創意的純體力工做亟需被AI所取代,咱們的摳圖算法應運而生。算法
近幾年圖像摳圖算法逐漸進入人們的視野,如騰訊(每天P圖)、百度(人像摳圖、汽車分割)等。而潛藏在其背後的行業:泛文娛,電商行業、垂直行業,諸如在線餐飲、媒體、教育等行業商業價值不容小覷,能夠知足各類戰報、在線課程教師摳圖、視頻封面製做等不一樣形式的圖片製做需求拓展。市面上的一些摳圖算法效果在人像髮絲細節處理均不是很好,且對一些通用場景(電商等)支持也不是很好。咱們針對這兩個問題一方面設計更具備泛化能力的系統、一方面深化髮絲和高度鏤空相關算法,均有更好的效果。小程序
咱們最開始在上手鹿班「批量摳圖」需求時,發現用戶上傳的圖像質量、來源、內容五花八門,想用一個模型實現業務效果達到一勞永逸很難。在通過對場景和數據的大量分析後,定製總體框架以下:設計模式
主要涵蓋了過濾、分類、檢測、分割四個模塊:api
如何讓效果更精準?架構
目前分類、檢測模型相對比較成熟,而評估模型則須要根據不一樣場景作一些定製(電商設計圖、自然攝影圖等),分割精度不足,是全部模塊中最薄弱的一個環節,所以成爲了咱們的主戰場。詳述以下:框架
一、對特徵金字塔每一層featuremap都融合上下相鄰層特徵,這樣輸出的特徵潛在表徵能力更強;
二、特徵金字塔不一樣層特徵分別預測,候選anchors可增長對尺度變化的魯棒性,提高小尺度區域召回;
三、對候選anchor的設定增長一些可預見的scale,在商品尺寸比例比較極端的狀況下大幅提高普適性;工具
與傳統的只須要分別前景、背景的圖像分割(segmentation)問題不一樣,高精度摳圖算法須要求出某一像素具體的透明度是多少,將一個離散的0-1分類問題變成[0, 1]之間的迴歸問題。在咱們的工做中,針對圖像中某一個像素p,咱們使用這樣一個式子來進行透明度預測:
得以商業應用的基礎是咱們在應用層單點能力,如人像/人頭/人臉/頭髮摳圖、商品摳圖、動物摳圖,後續還會逐步支持卡通場景摳圖、服飾摳圖、全景摳圖等。據此咱們也作了一些產品化工做,如鹿班的批量白底圖功能、E應用證件照/戰報/人物換背景(釘釘->個人->發現->小程序->畫蝶)等。
試用地址:https://ivpd.console.aliyun.com/api-image
接入說明:https://help.aliyun.com/document_detail/139269.html
本文做者:機器智能技術
本文爲阿里雲內容,未經容許不得轉載。