php解析word,得到文檔中的圖片

word文檔的兩種存儲格式:doc和docxhtml

doc:習慣上被稱爲word,採用二進制存儲數據xml

docx:也就是word2007,採用xml存儲數據htm

那麼後綴明明是docx格式的,爲何成xml格式了?blog

...文檔

你認爲的docx文檔,實際上是一個壓縮文件~get

具體轉這篇博文:二進制

http://www.javashuo.com/article/p-ufjfcosi-e.html數據

相關文章
相關標籤/搜索