FUNSD dataset 數據集介紹

數據集介紹 一個可用於FUNSD(噪聲很多的掃描文檔)上進行表單理解的數據集。 這裏的表單理解是指對錶單中的文本內容進行抽取,並生成結構化數據。 數據集包含199個真實的、完全註釋的、掃描的表單。 文檔有很多噪聲,而且各種表單的外觀差異很大,因此理解表單是一項很有挑戰性的任務。 該數據集可用於各種任務,包括文本檢測、光學字符識別、空間佈局分析和實體標記/鏈接。 第一個具有完整註釋的公共數據集,可用
相關文章
相關標籤/搜索