論文閱讀 PixelLink: Detecting Scene Text via Instance Segmentation

原文https://arxiv.org/pdf/1801.01315.pdf 摘要(Abstract) 最先進的場景文本檢測算法是基於深度學習的方法,它依賴於邊界框迴歸,並執行至少兩種預測:文本/非文本分類和位置迴歸。迴歸在這些方法中對邊界框的獲取起着關鍵作用,但這並不是必不可少的,因爲文本/非文本預測也可以看作是一種包含完整位置信息的語義分割。然而,場景圖像中的文本實例之間往往距離很近,很難通過
相關文章
相關標籤/搜索