你應該知道的大數據領域12大動向

最近這幾周大數據領域可謂動做頻頻,初創公司和老牌企業都紛紛發佈新品,更新或改進現有的產品系列,以及達成戰略性關係。數據庫

行業觀察人士表示,許多企業拿來試點階段的大數據系統(尤爲是那些整合Hadoop平臺的系統)後,將它們部署到更普遍的生產環境。本文介紹的新聞主要旨在幫助公司進行這種轉型。安全

下面看一下引發咱們關注的12則與大數據有關的動向。其中許多來自近日在加州聖何塞召開的2016年Hadoop峯會。架構

Actian發佈VectorH 5.0數據庫app

Actian首席營銷官託尼·卡瓦諾(Tony Kavanaugh,圖左)與Actian合做夥伴銷售副總裁戴夫·休格曼(Dave Sugarman)在近期召開的2016年Hadoop峯會上交談。框架

Actian本週發佈了Actian Vector in Hadoop(VectorH)5.0,這是該公司現已與Apache Spark集成起來的SQL-in-Hadoop數據庫的新版本。機器學習

與Spark集成起來後,就能夠獲取來自不一樣數據源、採用不一樣格式的數據,讓開發人員得以利用VectorH,構建高性能數據流、ETL和機器學習等應用程序。隨着企業組織將Hadoop分析系統遷移到生產環境,這類功能相當重要。分佈式

Actian還大肆宣傳VectorH的更高性能,聲稱性能比像Apache Hive、Cloudera Impala、Apache Spark SQL和Apache HAWQ這些與之競爭的技術更勝一籌,並援引了TPC-H查詢基準測試方面的結果。工具

Hortonworks經銷AtScale的BI-on-Hadoop軟件oop

AtScale開發AtScale智能平臺,這讓經常使用的業務分析工具得以訪問存儲在Hadoop集羣裏面的數據。性能

在Hadoop峯會上,Hadoop軟件開發商Hortonworks表示,從今年第三季度開始,它將經銷AtScale的軟件,做爲其圍繞Hortonworks數據平臺的套裝軟件解決方案的一部分。

AtScale首席執行官戴夫·馬裏安尼(Dave Mariani)表示,考慮到Hortonworks的市場地位,這種關係將爲AtScale提供一條重要的軟件銷售渠道。他告訴CRN:「咱們認爲,這方面大有潛力帶來新業務。」

Attunity發佈Visibility For Hadoop系統

Attunity是一家大數據管理軟件開發商,它發佈了最新版本的Visibility for Hadoop系統,可幫助管理員回答諸如此類的問題:誰在訪問Hadoop數據,他們在如何使用數據,以及在此過程當中使用了哪些種類的IT資源。那些答案對於在基於Hadoop的數據湖生產環境裏面管理數據增加和工做負載性能來講相當重要。

新版本提供了更全面的分析功能,可幫助企業組織衡量Hadoop數據和存儲使用狀況,用於更準確的容量規劃、優化成本效益,並知足數據治理和合規要求。新功能支持Hadoop文件系統的存儲級別,還支持衆多Hadoop數據處理引擎,包括MapReduce、Tez、Hive和Cloudera Impala。

Dataguise DgSecure 6.0

Dataguise發佈了新版本的DgSecure軟件,這個軟件是以數據爲中心的安全平臺,數據經理和首席信息安全官可使用該平臺,管理傳統關係數據庫和大數據平臺中的敏感數據。

DgSecure 6.0與一系列普遍的數據平臺和數據源兼容,並支持本地系統和雲系統中的結構化數據、半結構化數據和非結構化數據。它提供了數據檢測、保護和監控功能,用於數據治理。它還與一系列更普遍的IT和數據管理框架兼容。

新版本還使用內置模板和自定義模板,簡化了制定數據治理策略的工做。

Hortonworks發佈HDP 2.5預覽版

Hortonworks將在今年第三季度發佈旗艦Hortonworks數據平臺軟件的下一個版本,符合該公司在今年初承諾這款基於Apache Hadoop的軟件遵照的「快速發佈」時間表。

HDP 2.5經過分別支持Apache Ranger和Apche Atlas,增添了該系統的安全功能和治理功能。另外獲得支持的還有Apache Zeppelin,這種基於Web的筆記本用於使用SQL、Scala、Python及其餘開發語言,建立交互式分析文檔。HDP 2.5還與最新版本的Apache Ambari集成起來,用於規劃、安裝和配置Hadoop系統。

Hortonworks還發布了加強版的Partnerworks合做夥伴計劃,添加了一些項目,旨在招募託管服務提供商,並服務於獨立軟件開發商和獨立硬件廠商合做夥伴。

Koverse 2.0加快數據湖的實施

初創公司Koverse提供一種「一體化數據湖」平臺;該公司表示,相比目前的技術和方法,有了該平臺,就能夠大大加快收集大數據、部署到生產環境的速度,並下降成本。

該公司創辦於2012年,兩年多前開發了早期版本的技術。Koverse平臺2.0於6月21日發佈,它採用了Apache Accumulo的「分佈式鍵/值存儲」技術和該公司的通用索引引擎(Universal Indexing Engine)。

聯合創始人保羅·布朗(Paul Brown,首席產品官)和阿倫·科多瓦(Aaron Cordova,首席技術官)曾在美國國家安全局(NSA)從事過數據科學家的工做,他們幫助開發了最初的Accumulo項目,爲該部門的數據基礎設施從新設計了架構,以便更好地處理意想不到的數據分析情形。如今他們把這一專長帶給了Koverse的客戶。

Looker更新嵌入式分析工具集

Looker商業智能平臺能夠訪問駐留在數據庫中或雲端的數據。該公司的Powered by Looker工具讓開發人員得以將那些功能嵌入到應用程序中,或者構建具備數據探查和分析功能的自定義應用程序。

本週,該公司更新了Powered by Looker,增添了預製應用程序模板、預製網頁和應用程序窗口組件庫、加強型API庫,以及衆多新功能,好比支持Javascript對話,那樣更容易把Looker嵌入到應用程序裏面。

Pepperdata Hadoop Health Check

Pepperdata開發的軟件用於管理和改進Hadoop集羣的性能。這家廠商啓動了Hadoop Health Check計劃;按照該計劃,該公司使用軟件對至少100個節點組成的Hadoop集羣進行補充性評估。該軟件能夠收集並分析Hadoop性能數據,該公司開發了診斷報告,可準確查出耗用太多IT資源的有問題的用戶或任務,識別未獲得充分利用的集羣資源,並將處理方面的瓶頸標記出來。

Talend發佈通過更新的大數據集成平臺

Talend發佈了新版本的Talend Data Fabric平臺,用於集成駐留在本地或雲端的數據和應用程序。

新版本的Talend Data Preparation軟件是Data Fabric系統的一部分,它爲一系列普遍的業務用戶提供了加強的自助式數據準備功能,而不是像許多數據準備工具那樣將它們侷限於一小批熟悉數據的用戶。該公司表示,工具集提供了更直觀的數據準備功能,還提供了基於角色訪問共享式數據存儲區的功能。

Talend Data Mapper中的新功能經過更容易地處理龐大數據集,以識別數據模式,找到新的商機,幫助公司更好地發揮公司數據湖的運營價值。Talend Data Fabric還新增了Talend Integration Cloud和亞馬遜Redshift中的數據集成任務之間的安全套接層通訊。

Teradata發佈支持Presto的技術

企業數據倉庫開發商Teradata發佈了技術,支持它所發行的來自許多大數據分析軟件開發商的Presto SQL-on-Hadoop軟件。

Presto最初由Facebook開發,這個開源分佈式查詢引擎能夠針對各個數據源運行交互式查詢,包括Apache Hive、Apache Cassandra、 Hadoop分佈式文件系統、關係數據庫,甚至專有的數據存儲系統。Teradata的Presto發行版是這家開發商的Teradata統一數據架構的一部分。

支持Teradata的Presto的軟件開發商包括:Tableau、Looker、Information Builders、Qlik和Zoomdata,MicroStrategy和微軟正努力認證其商業智能工具,以便與該軟件兼容。

Waterline Data軟件支持Apache Atlas

Waterline Data開發同名的Smart Data Catalog軟件,能夠清點數據湖資產,改善數據發現功能,而且讓公司更容易從那些資產獲取價值。

Smart Data Catalog如今與Apache Atlas這種開源數據治理技術在Hortonworks數據平臺裏面集成起來。藉助Waterline Smart Data Catalog,Apache Atlas用戶就能夠將人工的元數據標記換成自動化流程,對數據湖資產進行分類,並改善數據治理。

Zoomdata的可視化分析軟件支持MapR和Apache Drill

Zoomdata提供一種大數據可視化分析平臺,可以實時處理本地環境和雲環境中龐大而複雜的查詢。

Zoomdata的軟件現已經過認證,可與基於Hadoop的 MapR融合數據平臺兼容,這兩家公司正在展開合做,致力於改進產品整合和支持。

做爲此次合做的一方面,Zoomdata表示,它開發了一款「智能鏈接件」(smart connector),可以以原生方式將其軟件與Apache Drill聯繫起來,後者是一種開源SQL查詢引擎,能夠訪問一大批NoSQL數據庫和文件系統中的數據。

相關文章
相關標籤/搜索