JavaShuo
欄目
標籤
LayoutLM——文本與佈局的預訓練用於文檔圖像理解
時間 2021-01-22
標籤
數據結構與算法
文本挖掘
Deep Learning
欄目
大數據
简体版
原文
原文鏈接
摘要: 預訓練技術近年來在多種NPL任務中取得了廣泛的成功。儘管廣泛的NPL應用的預訓練模型,其大多聚焦於文本級別的操作,而忽略了佈局與風格信息,這對文檔圖像的理解至關重要。該篇論文提出了LayoutLM來聯合建模掃描文檔圖像的文本與佈局信息關係,這將有益於真實世界中大量的圖像理解任務,如文檔圖像的信息提取。此外,可以利用圖像特徵合併文字的視覺信息到LayoutLM中。這是第一次在單獨的文檔級預訓
>>阅读原文<<
相關文章
1.
賦能RPA時代,微軟發佈通用文檔理解預訓練模型LayoutLM
2.
#####haohaohaohao#######MSRA提出通用文檔預訓練模型LayoutLM,通往文檔智能之路!
3.
文檔佈局分析 & 扭曲文檔圖像恢復
4.
六種用於文本分類的開源預訓練模型
5.
UIButton的文本與圖片的佈局
6.
darknet訓練圖像分類圖像預處理研究
7.
RNN訓練文本
8.
BERT 中文預訓練模型使用
9.
Longformer:超越RoBERTa,爲長文檔而生的預訓練模型
10.
中文文檔預處理
更多相關文章...
•
WSDL 文檔
-
WSDL 教程
•
XSL-FO 文檔
-
XSL-FO 教程
•
常用的分佈式事務解決方案
•
Scala 中文亂碼解決
相關標籤/搜索
中文文檔
文檔
圖文解析
圖文詳解
文本處理
文本
本文
圖文
Chromium中文文檔
用文
大數據
PHP教程
MySQL教程
Spring教程
文件系統
應用
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
微軟準備淘汰 SHA-1
2.
Windows Server 2019 Update 2010,20H2
3.
Jmeter+Selenium結合使用(完整篇)
4.
windows服務基礎
5.
mysql 查看線程及kill線程
6.
DevExpresss LookUpEdit詳解
7.
GitLab簡單配置SSHKey與計算機建立連接
8.
桶排序(BucketSort)
9.
桶排序(BucketSort)
10.
C++ 桶排序(BucketSort)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
賦能RPA時代,微軟發佈通用文檔理解預訓練模型LayoutLM
2.
#####haohaohaohao#######MSRA提出通用文檔預訓練模型LayoutLM,通往文檔智能之路!
3.
文檔佈局分析 & 扭曲文檔圖像恢復
4.
六種用於文本分類的開源預訓練模型
5.
UIButton的文本與圖片的佈局
6.
darknet訓練圖像分類圖像預處理研究
7.
RNN訓練文本
8.
BERT 中文預訓練模型使用
9.
Longformer:超越RoBERTa,爲長文檔而生的預訓練模型
10.
中文文檔預處理
>>更多相關文章<<