DW(二):SqlServer PDW

當微軟發佈第一個SQL Server並行數據倉庫R2時(SQL ServerParallel Data Warehouse,即PDW),已正式將產品的名稱修改成分析服務平臺(APS),但在一些非正式場合,仍然保留了PDW的叫法數據庫

目錄:服務器

  • APS簡介
  • APS特性
  • NEC一體機
  • 戴爾數據庫一體機
  • 小結

APS簡介架構


  • 2014年4月推出了APS(Analytics Platform System),也稱爲PDW(ParallelData Warehouse);
  • 微軟分析平臺系統APS是一個集成了結構化和非結構化數據的數據倉庫平臺
  • 有戴爾、惠普、Quanta(廣達)、NEC提供了基於APS的一體機,而微軟是客戶得到硬件和軟件支持惟一聯繫方。所以,做爲一個數據倉庫設備,APS提供了單位存儲空間最低價格的用戶可用存儲(壓縮後)
  • APS一體機是一個針對現代數據倉庫需求的高性能和可擴展的並行處理設備。
  • APS一體機上集成了SQLServer PDW軟件(SQL Server專門爲了在APS中運行的大規模並行處理版本)和一個可選的HDInsightHadoop 平臺(基於HDP的Windows版微軟Hadoop產品)
  • APS的大數據功能及其包含的PolyBase支持使用標準的SQL查詢去訪問Hadoop數據和加入關係型數據,而不須要將數據預加載到數據倉庫中
  • 這種在傳統數據倉庫和大數據部署環境之間實現的無縫整合使APS成爲一個主流的企業級大數據平臺

APS特性併發


  • 它是一個大規模並行處理設備?(指aps的一體機),能夠並行和分佈的方式去處理高度併發和複雜度的查詢
  • SQL Server PDW運行在APS設備以內,它使用內存內可更新的行存儲索引去改進了數據加載和查詢響應時間,最多比傳統數據倉庫系統高50倍
  • APS在軟件中內置了可靠、可擴展和高性能的存儲特性,它們下降了硬件成本——並且它內置了支持容錯的硬件冗餘性
  • APS提供了內存內可更新的字段存儲索引,支持高達15倍的數據壓縮率,最高能夠節省70%的存儲需求。
  • APS是一個基於機架的系統,所以不會過多購買容量,一開始能夠只使用四分之一的機架,它支持修改設備容量大小,而後未來在須要時可使用傳統SQL Server系統橫向擴展的相同工具來擴展它的大小。

NEC一體機分佈式


  • NEC與微軟合做推出了強大的SQLServer PCle SSD一體機,它支持大規模在線事務處理(OLTP)和商業智能(BI)負載。
  • 它搭配NEC Express 5800可擴展的企業級服務器系列,包含一個4U服務器,最多支持四個英特爾的Xeon E7處理器,一共有24個物理內核。
  • 服務器還帶有16個可用的PCI-Express 3.0 I/O插槽和64個可用的DDR3內存插槽。
  • NEC數據庫一體機不只提供了高性能的數據處理,還預裝了HGST FlashMAX II PCIe閃存。FlashMAX II是一個多層的閃存單元,這意味着每個內存單元都可以存儲多個比特位信息,同時集成了爲閃存優化的硬件RAID原理。經過FlashMAX II設備,服務器可容納8.8TB的閃存存儲並提供8.2GBps的邏輯掃描速率。
  • 依照在SQL Server FastTrack Data Warehouse(FTDW)參考體系架構的概述,NEC一體機是按照最佳實踐配置進行構建的,FTDW定義了一個針對硬件吞吐量最大化SQL Server數據處理的核心平衡架構,NEC一體機使用FTDW配置來平衡CPU內核與I/O通道和存儲順序I/O的能力

戴爾數據庫一體機工具


  • 戴爾的數據庫一體機也集成了來自Fusion-io的閃存技術。
  • 與NEC有所不一樣,戴爾一體機不是圍繞着一個特定的平臺構建的。相反,其重點是在企業級應用上,包括了普遍的數據庫產品支持:MySQL,Sybase,Oracle數據庫,SAP HANA,MongoDB,Apache Cassandra,固然也包括SQL Server 2014+
  • 戴爾一體機使用了DellPowerEdge R720 2U機架服務器,可以支持12TB閃存、40GB帶寬和2.5每秒百萬的IOPS。閃存是經過Fusion io Memory設備提供而且使用自適應閃回(Adaptive FlashBack)保護數據。與許多依賴存儲配置的RAID閃存設備不一樣,自適應閃回的數據處理粒度已經提高到了數據塊級別,它簡化了管理並保證了業務連續性。
  • 當結合了Fusion-io閃存時,PowerEdge服務器可以顯著的提升數據負載的性能,同時減小延遲和I/O瓶頸。戴爾一體機能夠做爲一個獨立產品,也能夠提供包括光纖通道和無線帶寬技術的高可用產品使用

小結oop


  • APS一體機是針對可以支持PB級別大數據處理的產品,它專門針對BI和MPP數據分析負載,可以計算進行分佈式處理與並行操做,同時能夠將非結構化數據融入到架構中。
  • 若是SQL Server一體機在你的考量範圍內,那麼根據不一樣的需求會爲你提供多種選項。記住,這是一個快速變化的市場,在進行SQL Server一體機採購以前必定要事先作足功課。它們有不少優點,但相應的價格也很高,你必定不想採購以後才發現它並不適合你的需求
相關文章
相關標籤/搜索