Federated Learning for Vision-and-Language Grounding Problems

轉載自此處 文章背景 這篇文章的背景是這樣的,首先我的每個客戶端輸入的都是圖像,這些圖像可以是不同類型的,作者在實驗中是用了兩個不同的數據集來表示這一點。其次是每個客戶端的任務也可以是不同的,比如一部分做視覺問答,另一部分做圖像描述。因爲他們的任務不一樣,所以傳統的聯邦學習方法就不適用了。作者的方法概括的說就是讓服務端去學習一個對應於不同任務的圖像表示。具體的我們看下面這張圖,可以簡單的分爲三個階
相關文章
相關標籤/搜索