Pixel Aggregation Network (PAN)

1 網絡結構 訓練階段,網絡生成三個預測: Text Region Kenel Similarity Vector 其中 1 和 2 爲監督學習,3 爲無監督學習(聚類)。 預測階段,遵循以下步驟來使用相似度向量引導像素聚合到Kenel中 得到多個 Kenel; 對於每個 Kenel 的上下左右四個方向的像素,爲 Text Region 內的每個像素找到與 Kenel 的歐式距離小於 d d d
相關文章
相關標籤/搜索