數據虛擬化及其用例介紹

時間 2019-12-12

標籤數據虛擬及其介紹简体版

原文原文鏈接

數據虛擬化是解決幾個問題的解決方案。這種解決方案正在蓬勃發展，同比增加強勁。但咱們首先從定義開始。數據庫

Kezako？
數據虛擬化是在數據源和數據使用者之間插入數據訪問層以促進訪問的過程。在實踐中，咱們有一種SQL請求程序做爲工具，它可以查詢很是異構的數據源，從傳統的SQL數據庫到文本或PDF文件，或像Kafka這樣的流式源。簡而言之，您擁有數據，能夠查詢數據，並在此數據之間生成鏈接。實際上，您能夠提供統一且完整的數據視圖，即便它在多個系統之間「爆炸」。最重要的是，您擁有緩存和查詢優化器，能夠在性能方面最小化對源系統的影響。固然，您有一個數據目錄，可幫助您找到IT基礎架構中全部數據的方式。由此咱們能夠推導出兩個主要用例。緩存

集成用例
這是不可避免地想到的第一個用例。一家有點錯過「數字」轉變的大型銀行正在努力爲其客戶提供一個包含全部相關數據的門戶網站。舊的異構甚至是異國情調的系統，沒法同時支持成千上萬的客戶，這是該銀行的基礎。使用數據虛擬化解決方案，數據暴露的速度與您必須使用Hibernate在Java中執行簡單的DAO類同樣快。您能夠添加鏈接，使用數據目錄搜索數據，編寫請求，在API中公開它們，以及擁有公開數據所需的全部資產。這就是所有，就這麼簡單。製做API，若是您知道在何處查找數據，則須要5分鐘。固然，您不會實現插入和更新，但請記住，讀數佔客戶端門戶上80％的請求，而且CQRS模式不存在！您將經過API實現插入和更新，這確定會調用現有的事務！架構

這樣能夠節省大量時間，由於不須要經過ETL或Change Data Capture輸出數據，這須要您瞭解全部數據。工具

數據用例
兩個典型的用例是虛擬數據倉庫和虛擬數據湖。性能

關於虛擬數據倉庫，它的設置速度比傳統數據倉庫快得多。對於傳統的數據倉庫，您須要設置許多ETL流，若是新的業務須要須要新的ETL流，您已經編寫了規範，發送它，等待開發人員完成，而後測試。不管如何，你失去了一個月。對於虛擬數據倉庫，您能夠提出請求，並且，並且，就是這樣！測試

而後，使用虛擬數據湖的狀況容許您合併數據，不管其來源如何。它避免了您不得不詢問有關數據如何集成的許多問題：它使得數據可用和城市化變得容易。許多數據湖項目在v-cycle方法中已經丟失，城市化數據的建立將花費你一到兩年的時間。優化

最後，經過數據目錄，您能夠向企業，業務分析師，數據科學家和BI專家提供數據訪問。簡而言之，您正在普及數據訪問。網站