論文閱讀 PixelLink: Detecting Scene Text via Instance Segmentation

時間 2020-12-30

原文原文鏈接

原文https://arxiv.org/pdf/1801.01315.pdf 摘要（Abstract）最先進的場景文本檢測算法是基於深度學習的方法，它依賴於邊界框迴歸，並執行至少兩種預測:文本/非文本分類和位置迴歸。迴歸在這些方法中對邊界框的獲取起着關鍵作用，但這並不是必不可少的，因爲文本/非文本預測也可以看作是一種包含完整位置信息的語義分割。然而，場景圖像中的文本實例之間往往距離很近，很難通過