導讀 | 若是企業但願在雲計算的新平臺上實現數據倉庫和數據集市的現代化,那麼請注意,這並不像人們想象的那麼容易。 |
若是企業但願在雲計算的新平臺上實現數據倉庫和數據集市的現代化,那麼請注意,這並不像人們想象的那麼容易。html
在企業的數據倉庫和數據集市中,他們的數據一般太舊,處理過於繁瑣,並且成本過高。
linux
當今基於雲計算的數據分析有能力實時處理,數據庫可以以「需求速度」運行,甚至小型企業也能夠將數據分析處理與最新的新興技術結合在一塊兒,例如機器學習和預測算法。算法
但事實證實,基於雲計算的數據分析的路徑比許多企業預計的要漫長而艱難。所以,隨着IT遇到成本超支,技術沒法達到預期,以及數據龐大的數據證實存在等問題,企業的業務就開始出現問題。這是爲何。數據庫
首先,從企業向公共雲傳輸數據比預期的更麻煩,並且因爲工做的大部分人工處理性質而加重。AWS、Google、Microsoft和其餘公司都有本身的技術,好比AWS的Snowball。然而,即便使用這些工具,經過流程來移動數PB字節的數據也是很是棘手的,至少能夠這麼說。安全
其次,數據集成仍然是雲計算面臨的一個問題。遷移數據並不會奇蹟般地解決企業的集成挑戰。此外,記錄系統可能仍然保留在內部部署的數據中心中,所以須要及時與雲中如今存儲的數據同步以得到最新結果。這意味着要結合使用新舊數據集成技術,並創建包括數據移動和結構轉換的流程。機器學習
最後,基於雲的分析數據庫自己很複雜且難以配置。其中一些複雜性是因爲數據庫中的安全子系統形成的。這些都是必要的,但必須在數據庫和數據分析的背景下弄清楚。數據分析系統的其餘系統(不管是在雲中仍是在內部部署的數據中心)都必須具備系統安全性,這可能意味着大多數其餘須要實時分析的操做系統。工具
雖然這些雲計算分析的挑戰均可以克服,但IT部門應該瞭解,當它認爲(或者更有可能被告知)它將是一半時,其努力水平實際上多是百分之百。學習
所以,企業須要爲項目準備時間更長,預算更快耗盡,以及因爲這些問題致使的未能上升的狀況作好準備。雲計算
原文來自:https://www.linuxprobe.com/data-to-cloud-difficult.html操作系統