因果理論在視覺常識特徵學習中的應用

背景 文章提到,事實上,人類通過探索物理世界,自然而然地在無人監督的情況下學習常識,我們希望機器也能這樣模仿。一個成功的例子便是NLP中詞向量的學習,例如,一個詞的表示 X X X能夠通過預測它的上下文詞語 Y Y Y, P ( Y ∣ X ) P(Y|X) P(Y∣X)來學習到。 然而,在視覺任務中,這一情形卻有不同。原因是一旦一張圖像形成,圖像之中的各種物體爲何構成這個上下文情景是不得而知的,
相關文章
相關標籤/搜索