1109 - PDF 標註導出,從入門到棄坑

這兩天,研究了若是導出 PDF 標註。沒搞定,大體列一些關鍵的點,供你們參考:html

  • PDF 標準是 Adobe 牽頭搞了,標準又老又長,通常仍是別看了
  • Apple 提供了 PDFKit;不過,十幾年沒更新了,功能比較弱
    • 核心的,在解析標註文本時,會出現 Cmap 錯誤,但卻沒有任何可設置的地方
    • 另外,WWDC 2017 新出了 PDFKit for iOS,沒去研究,估計重點在於展現,不在於編輯
  • 對於第三方 PDF SDK:
    • 有少許免費、或開源的,最知名的是 Skim;惋惜的是,Skim 也沒法解析標註文本,尤爲是英文以外的文字、字體
    • 而更大部分,則是商業 SDK;效果我很差說,由於動不動 $1000 一年的受權,試不起
  • PDF Expert 果真仍是厲害,在試過的這些產品中,最強悍;固然,價格也最彪悍

總的來看,PDF 仍是一小撮玩家在玩的小遊戲。既得利益者,緊緊把握着市場;後來者,不太可能進入並有所做爲。標準自己,也缺少與時俱進的動力。我並不看好。工具

不過,我仍是基於 Apple 的 PDFKit 作了個簡單的小工具,能夠將 PDF 中的標註導出爲 csv 文本。須要的朋友,能夠單獨聯繫我。字體


博客原文:1109 - PDF 標註導出,從入門到棄坑htm

相關文章
相關標籤/搜索