Camelot:一個從pdf抽取表格數據的Python庫

PDF誕生自Camelot項目。目的是建立一個通用的文檔交流格式,以支持多種機器平臺,操做系統和通訊網絡。其目標是使文檔可以在任何顯示器上可視,在任何現代打印機上可打印。PDF基於PostScript(一種頁面描述語言)。該語言解決了在任意地方顯示和打印的問題。PDF包含了文檔「在任意地方可視和打印」所需的組件。好比,字符、字體、圖表、圖片等。python 一個PDF文檔包含許多放置文字(或其餘組
相關文章
相關標籤/搜索