Pixel Aggregation Network (PAN)

時間 2021-01-12

原文原文鏈接

1 網絡結構訓練階段，網絡生成三個預測： Text Region Kenel Similarity Vector 其中 1 和 2 爲監督學習，3 爲無監督學習（聚類）。預測階段，遵循以下步驟來使用相似度向量引導像素聚合到Kenel中得到多個 Kenel；對於每個 Kenel 的上下左右四個方向的像素，爲 Text Region 內的每個像素找到與 Kenel 的歐式距離小於 d d d