用Java 實現斷點續傳 (HTTP)

在web項目中上傳文件夾如今已經成爲了一個主流的需求。在OA,或者企業ERP系統中都有相似的需求。上傳文件夾而且保留層級結構可以對用戶行成很好的引導,用戶使用起來也更方便。可以提供更高級的應用支撐。前端

數據表結構文件java

文件夾數據表結構程序員

文件數據表結構web

該項目核心就是文件分塊上傳。先後端要高度配合,須要雙方約定好一些數據,才能完成大文件分塊,咱們在項目中要重點解決的如下問題。redis

如何分片;數據庫

如何合成一個文件;後端

中斷了從哪一個分片開始。服務器

如何分,利用強大的js庫,來減輕咱們的工做,市場上已經能有關於大文件分塊的輪子,雖然程序員的天性曾迫使我從新造輪子。可是由於時間的關係還有工做的關係,我只能罷休了。最後我選擇了百度的WebUploader來實現前端所需。網絡

如何合,在合以前,咱們還得先解決一個問題,咱們如何區分分塊所屬那個文件的。剛開始的時候,我是採用了前端生成了惟一uuid來作文件的標誌,在每一個分片請求上帶上。不事後來在作秒傳的時候我放棄了,採用了Md5來維護分塊和文件關係。app

在服務端合併文件,和記錄分塊的問題,在這方面其實行業已經給了很好的解決方案了。參考迅雷,你會發現,每次下載中的時候,都會有兩個文件,一個文件主體,另一個就是文件臨時文件,臨時文件存儲着每一個分塊對應字節位的狀態。

文件夾準備邏輯

這些都是須要先後端密切聯繫才能作好,前端須要根據固定大小對文件進行分片,而且請求中要帶上分片序號和大小。前端發送請求順利到達後臺後,服務器只須要按照請求數據中給的分片序號和每片分塊大小(分片大小是固定且同樣的)算出開始位置,與讀取到的文件片斷數據,寫入文件便可。

爲了便於開發,我 將服務端的業務邏輯進行了以下劃分,分紅初始化,塊處理,文件上傳完畢等。

服務端的業務邏輯模塊以下

 

 

功能分析:

文件夾生成模塊

 

文件夾上傳完畢後由服務端進行掃描代碼以下

初始化文件的邏輯

初始化文件夾的邏輯

保存文件(將文件信息寫入到數據庫)邏輯

 

寫入文件夾的邏輯

分塊上傳,分塊處理邏輯應該是最簡單的邏輯了,up6已經將文件進行了分塊,而且對每一個分塊數據進行了標識,這些標識包括文件塊的索引,大小,偏移,文件MD5,文件塊MD5(須要開啓)等信息,服務端在接收這些信息後即可以很是方便的進行處理了。好比將塊數據保存到分佈式存儲系統中

分塊上傳能夠說是咱們整個項目的基礎,像斷點續傳、暫停這些都是須要用到分塊。

分塊這塊相對來講比較簡單。前端是採用了webuploader,分塊等基礎功能已經封裝起來,使用方便。

藉助webUpload提供給咱們的文件API,前端就顯得異常簡單。

文件刪除和進度更新的邏輯

分則必合。把大文件分片了,可是分片了就沒有本來文件功能,因此咱們要把分片合成爲本來的文件。咱們只須要把分片按本來位置寫入到文件中去。由於前面原理那一部咱們已經講到了,咱們知道分塊大小和分塊序號,我就能夠知道該分塊在文件中的起始位置。因此這裏使用RandomAccessFile是明智的,RandomAccessFile能在文件裏面先後移動。可是在andomAccessFile的絕大多數功能,已經被JDK1.4的NIO的「內存映射文件(memory-mapped files)」取代了。我在該項目中分別寫了使用RandomAccessFile與MappedByteBuffer來合成文件。分別對應的方法是uploadFileRandomAccessFile和uploadFileByMappedByteBuffer。兩個方法代碼以下。

秒傳功能

服務端邏輯

數據庫驗證邏輯,秒傳功能實際上就是在數據庫中檢查相同MD5的邏輯

秒傳功能,相信你們都體現過了,網盤上傳的時候,發現上傳的文件秒傳了。其實原理稍微有研究過的同窗應該知道,其實就是檢驗文件MD5,記錄下上傳到系統的文件的MD5,在一個文件上傳前先獲取文件內容MD5值或者部分取值MD5,而後在匹配系統上的數據。

Breakpoint-http實現秒傳原理,客戶端選擇文件以後,點擊上傳的時候觸發獲取文件MD5值,獲取MD5後調用系統一個接口(/index/checkFileMd5),查詢該MD5是否已經存在(我在該項目中用redis來存儲數據,用文件MD5值來做key,value是文件存儲的地址。)接口返回檢查狀態,而後再進行下一步的操做。相信你們看代碼就能明白了。

嗯,前端的MD5取值也是用了webuploader自帶的功能,這仍是個不錯的工具。

控件計算完文件MD5後會觸發md5_complete事件,並傳值md5,開發者只須要處理這個事件便可,

快速上傳的邏輯

斷點續傳

up6已經自動對斷點續傳進行了處理,不須要開發都再進行單獨的處理。

在f_post.jsp中接收這些參數,並進行處理,開發者只須要關注業務邏輯,不須要關注其它的方面。

 

斷點續傳,就是在文件上傳的過程當中發生了中斷,人爲因素(暫停)或者不可抗力(斷網或者網絡差)致使了文件上傳到一半失敗了。而後在環境恢復的時候,從新上傳該文件,而不至因而重新開始上傳的。

前面也已經講過,斷點續傳的功能是基於分塊上傳來實現的,把一個大文件分紅不少個小塊,服務端可以把每一個上傳成功的分塊都落地下來,客戶端在上傳文件開始時調用接口快速驗證,條件選擇跳過某個分塊。

實現原理,就是在每一個文件上傳前,就獲取到文件MD5取值,在上傳文件前調用接口(/index/checkFileMd5,沒錯也是秒傳的檢驗接口)若是獲取的文件狀態是未完成,則返回全部的還沒上傳的分塊的編號,而後前端進行條件篩算出哪些沒上傳的分塊,而後進行上傳。

當接收到文件塊後就能夠直接寫入到服務器的文件中

這是文件夾上傳完後的效果

 

這是文件夾上傳完後在服務端的存儲結構

 

參考文章:http://blog.ncmem.com/wordpress/2019/08/12/java-http%E5%A4%A7%E6%96%87%E4%BB%B6%E6%96%AD%E7%82%B9%E7%BB%AD%E4%BC%A0%E4%B8%8A%E4%BC%A0/

相關文章
相關標籤/搜索