透過一張簡單的食物照片你能看到什麼?當時和你一塊兒吃飯的人?用餐的那個餐館播放的爵士樂?或者是懷念那一口美味的,本身卻作不出吃不到的家鄉菜?社羣最新研究,使用 AI 技術,只須要一張食物的圖片就能夠洞悉它的烹飪方法。該系統透過新穎的架構預測成分做爲集合,在不強加任何順序的狀況下對其依賴性進行建模,而後透過同時處理圖像及其推斷成分來生成烹飪指令。架構
AI 變身大廚:看一眼就知道這道菜怎麼作的性能
一份優良的食譜不只可以寫清楚配料,還要有清晰的烹飪步驟,例如大火爆炒幾分鐘,小火慢燉幾分鐘,是切絲仍是切塊等等。以前,傳統的作法是將圖片轉圖譜問題看作一種「檢索任務」,即根據圖片的類似度從食譜數據集中配對烹飪方案。這類系統的性能在很大程度上取決於數據集的大小和多樣性,以及圖片的質量。若是數據集中根本沒有圖片對應食譜,這個系統就很是失敗。將圖片到食譜當作條件生成問題能夠很好的解決傳統系統的難題。換句話說,與直接的圖片配對不一樣,後者更多的是預測配料的成分,而後根據配料和其對應的美食圖片生成烹飪步驟。相關內文來源:仲博流浪收容所 http://hungtu.com.tw/spa
除了食譜,以後可能還能識別卡路里3d
從食品圖片到菜譜,須要得到超越僅僅是可見的圖片以外的訊息,這對於當前的計算機視覺系統無疑是一個巨大挑戰。與單純理解天然圖像相比,視覺成分預測須要的還有高級推理和先驗知識,例如,羊角麪包中含有黃油。 由於食品具備比較高的類別內可變性 intra-class variability,食物的形態在烹飪過程當中發生改變,一道煮熟的菜餚和生的原料的樣子可能天差地別。逆烹飪的實現是邁向更普遍的食品理解系統的第一步,接下來也許就能夠透過照片實現系統對於食物的卡路里估算和自動建立食譜。成分預測也能夠用於解決更普遍的問題,例如實現圖象到集合的預測。blog