Internet Archive 的海量存儲淺析

Internet Archive(IA) 這個站點大家應該都不陌生。IA 旨在建立所有互聯網站點的」檔案庫」,如果說 Google 是互聯網的數據庫的話,那麼 IA 就是互聯網的數據倉庫了,定期對每個 Web 頁面保存快照,數據量之大可想而知。 先看看 IA 每天需要面對的處理能力: 存儲超過 850 億個 Web 頁面; 每天大約 600 萬次的下載; Wayback Machine 收到大約
相關文章
相關標籤/搜索