伯克利的雲計算報告(下)

7.雲計算的10大障礙


雲計算被公衆接受有三大技術障礙;被接受後,雲計算的增加又面臨五大技術障礙;最後兩個障礙是政策和商業障礙。雲計算提供商在長期探索過程當中會逐漸克服這些障礙。

7.1服務的可用性


用戶最大的擔憂是雲計算是否有足夠的可用性,2008年Amazon EC二、GAE和Gmail都出現過服務中斷的事故,持續數小時。只使用一家公司的雲計算服務,會遇到單點故障的問題。即便這家公司很是大,有多個不一樣地理位置的數據中心,它們使用的仍然是同一套軟件設施,甚至這家公司倒閉了怎麼辦。一些大企業會由於擔心這個問題而不肯意使用雲計算。對於這個問題,惟一可行的解決辦法是使用多家雲計算提供商。

另外一個可用性問題是DDoS(Distributed Denial of Service)攻擊,攻擊者用大量的殭屍計算機訪問服務,致使合法用戶沒法使用服務。效用計算能夠經過快速擴展計算能力來抵禦DDoS。

7.2數據鎖定


雲計算欠標準化,各個雲計算提供商的API都是不同的,所以用戶很難在不一樣雲計算提供商之間遷移。將用戶鎖定對雲計算提供商是有利的,可是對用戶不利,這也阻礙了部分用戶接受雲計算。

最直接的解決辦法是推進雲計算的標準化,用戶能夠輕鬆地在不一樣雲計算服務之間遷移。

7.3數據保密


總能夠聽到這樣的聲音:「我永遠不會將敏感的企業數據放到雲端。「如今的雲服務都是用廣域網傳輸數據,很容易受到攻擊。咱們認爲雲計算的安全不存在本質的障礙,現有的安全技術已經足夠成熟,好比數據加密,ssl安全傳輸,虛擬局域網,防火牆等。

7.4數據傳輸瓶頸


應用正變得愈來愈數據密集。由於帶寬資源的降價要比計算和存儲慢多了,因此當應用部署到雲端,數據傳輸成本將成爲嚴重的問題。

有一個看起來離奇的辦法。Jim Gray發現傳輸大量數據最便宜的辦法是直接快遞磁盤甚至整臺計算機。雖然沒有硬件廠商能保證這種方法的可靠性,可是Jim Gray的實驗代表每400次纔會失敗1次,並且能夠組織成「raid」來提升可靠性。

最完全的辦法是快速下降帶寬的成本,研究代表高端路由器佔了WAN帶寬成本的2/3,光纖只佔了1/3。研究人員正在尋找用普通商用組件替代高端路由器的方法。

7.5性能不可預知


多個虛擬機之間能夠很好地共享CPU和內存,可是IO共享仍然存在問題。一個辦法是改進體系結構和操做系統,更有效地支持中斷虛擬化和IO虛擬化。另外一個辦法是使用flash存儲介質,減小IO衝突。另外一個不可預知的問題是運行某些批處理程序時多個虛擬機之間的調度問題,這在高性能計算領域尤爲明顯。

7.6可擴展存儲


雲計算最大的吸引力是短時間租用、無預先投資、無限資源。這對於計算的意義是顯而易見的,可是對於存儲則不太明顯。個人理解是計算是可複用的,可是持久化存儲不能複用。

針對這個問題已經有很多嘗試,從提供豐富的查詢和存儲API,提供性能保證,到存儲系統直接支持複雜數據結構。如今的機遇是創造一種存儲系統,不只能知足上述須要,並且具備按需任意伸縮的優勢,同時在資源管理的可擴展性、數據持久性和高可用性方面知足程序員的需求,這仍然是個開放的研究課題。

7.7大型分佈式系統的bug


在大型分佈式系統中排除bug,是一件很大的挑戰。這些bug在小規模應用時可能不能重現,所以必須在真實環境debug。雲計算依賴虛擬機多是個好消息,程序員可能得到在傳統分佈式系統難以得到的一些信息。

7.8快速伸縮


pay-as-you-go應用到存儲和帶寬很天然,都使用字節計費。可是計算有點不一樣,這取決於虛擬化的層次。GAE根據負載自動擴展,按照CPU週期收費;Amazon EC2則按照用戶佔用實例的時間收費,即便這段時間用戶啥都沒幹。

這裏的機遇是根據負載自動伸縮計算規模,在不影響服務級別的狀況下節約成本。自動伸縮的另外一個好處是節約資源,數據中心對環境的影響已經愈來愈受到關注。

7.9聲譽共享


資源能夠虛擬化,可是聲譽卻很難虛擬化。一個顧客的行爲能夠影響到整個雲的聲譽。建立相似信任郵箱的聲譽保護服務多是一個機遇。另外一個問題是法律責任的轉移,雲計算提供商但願客戶承擔本身的法律責任,而不是轉嫁給他。

7.10軟件許可


如今的軟件許可限制了運行軟件的計算機,用戶購買軟件並支付年度維修費用。不少雲計算提供商使用開源軟件,一部分緣由就是商業軟件的許可證模式不適合雲計算。對於開源軟件,主要的機遇是繼續流行下去;對於商業軟件,主要的機遇是改變許可證模式更好地適應雲計算。

8.雲計算的影響


雲計算會對IT產業產生巨大的影響,開發人員應該要知道如何設計能部署到雲計算的下一代系統。一般,重點是系統的橫向擴展問題,這對軟硬件設計具備特別的暗示:

    • 將來的應用一部分在客戶端,一部分在雲端。雲端的部分具備可迅速伸縮的特色,而客戶端應該在離線狀態也能使用。

    • 將來的基礎軟件應該能感知本身是跑在虛擬機而不是物理裸機之上。基礎軟件應該在一開始就創建本身的計費系統。

    • 將來的硬件應該被設計成按容器(至少12個機架)擴展,而不是按單個機架擴展,由於容器將是購買硬件的最小單位。在內存、磁盤和網絡閒置的時候,應該可以進入節能狀態。flash應該添加到新的存儲體系結構裏,位於內存和磁盤之間。最後,數據中心交換機和WAN路由器的成本和帶寬須要改進。
相關文章
相關標籤/搜索