當基於文本的文件上傳到 Confluence(例如,Word,PowerPoint 等),這些文件中的文本是能夠提取而且添加到索引中的,用戶能夠經過索引來搜索這些文件中的文本內容,不單單是搜索文件名。當文件須要被從新索引的時候,咱們存儲提取後的文本,咱們不須要對文本中的內容從新進行索引。code
提取後的文本文件,一般是以版本號進行命名的,例如 2.extracted_text
, 同時還會存儲文件本身的版本(如上面第八級目錄中描述的)。咱們只保存提取後文件的最新的版本,而不是和文件同樣同時還保存了早期的版本。索引
https://www.cwiki.us/display/CONF6ZH/Hierarchical+File+System+Attachment+Storageget