《 Deep web data extraction based on visual information processing》
做者 J Liu 上海海事大學 2017 AIHC會議登載
引用 Liu J, Lin L, Cai Z, et al. Deep web data extraction based on visual information processing[J]. Journal of Ambient Intelligence & Humanized Computing, 2017(1):1-11.
一種基於卷積神經網絡(CNN)的數據區域定位方法
結合視覺信息進行網頁的分割(做者命名爲VIBS)web
CNN網絡結構由3個階段組成,如圖所示 。第一階段設置卷積層和聚集層以學習圖像的特徵。第二階段是設置展平圖層所必需的,展平圖層會將卷積圖層和合並圖層生成的特徵圖轉換爲一維矢量,以計算完整的鏈接圖層。除了爲輸出設置最後一個徹底鏈接以外,第三階段設置多個鏈接層以過濾先前層學習的特徵。
網絡架構設計使用13級CNN,包括5個採樣層(S),6個卷積層(C)和2個徹底鏈接層。網絡
據區域檢測的標準IOU,若是IOU > 50%,則數據區域被視爲正樣本。架構
區域定位主要步驟流程圖以下ide
58,500個樣本數據集,其中有195種具備不一樣大小和不一樣位置的圖像樣本,包含數據區域,總共300個組。學習
整體看下來,文章的創新意義大於實際意義吧,這麼高的精確度,感受像是過擬合了,並且速度不可能這麼快,應該是把網頁先行保存成圖片了的,文章寫得很不錯,對比什麼的體系也比較完善,就是有些地方沒有講清楚,好比可否divide的斷定等。spa