微軟開源的Trill是什麼?

 

如下是一篇15年的文章的譯文:https://dwainegilmer.wordpress.com/2015/01/28/microsoft-trill-for-streaming-analytics-from-microsoft-research/git

 

當今許多大數據應用程序套件的重點是數據存儲。它們是圍繞狹窄範圍的數據集設想和設計的,一般是爲了組織內的特定業務功能使用。github

 

對新數據源的不斷增長的需求使得許多BI應用程序在短短几年內就過期了。使人遺憾的是,對於許多公司而言,他們的大數據戰略是存儲數據,直到其實際業務價值能夠在將來某個時間解鎖。算法

 

在這些快節奏的時代,大多數企業迫切須要是實時的處理數據,而不是僅僅存儲數據並應用一組工具進行滯後的離線分析。Trill則能夠從數據中實時提取可用的知識和分析結果。基於實時的當前信息對決策提供可靠的支持和制定。這最終將改善整個決策過程。數據庫

 

流分析應用程序在數據到達時就能夠開始搜索分析數據。而不是經過查詢數據庫以拉取數據信息流來進行分析,將常設查詢應用於在捕獲數據時產生事件(推送)的數據流。api

 

與傳統關係型數據庫比較。SQL Server旨在存儲和管理靜態數據,Trill則旨在分析動態數據。基於Trill構建的應用程序將流傳遞給一組查詢,這些查詢分析數據並在找到匹配項時觸發事件完成實時結果推送。app

 

在大數據的新時代,公司正在競相推出大數據系統。這些系統本質上是用於檢查,轉換,存儲和建模業務數據的第一代緊耦合平臺。Microsoft Trill(天天萬億事件)是Data Analytics層的一部分。ide

 

能夠在Microsoft.com上能夠找到介紹Trill的Microsoft Research(MSR)研究論文  。 Microsoft Trill是用於分析的流分析引擎或查詢處理器。Trill被設計爲大數據的查詢處理器,有三個要求: wordpress

1) 查詢模型:使用早期結果實時處理流式和關係查詢,並提供離線查詢;工具

2) 結構和語言集成:提供從高級語言庫輕鬆訪問,以便與現有分發結構和應用程序集成;性能

3) 性能:低延遲和高吞吐量。

 

與Apache Storm,Microsoft SQL StreamInsight,Vertica Shark和Naiad Spark流相比,Trill具備許多優點。Trill也將取代微軟的StreamInsight。下面是Microsoft的圖表,說明了差別並比較了功能集。 

 

Trill具備時間語義化查詢的能力,容許用戶「經過實時或離線數據集的方式進行復雜查詢」,而且因爲分析引擎「在預期的使用場景中具備高性能」,所以能夠比之前更快地得到結果。

 

Trill使用批量處理事件的新技術和算法。而且,這些批次中的數據以一種促使查詢更有效地方式執行與組織。

 

結論

事實上,咱們目前的總存儲容量能提供的能力遠遠落後於存儲新的和變化的數據流不斷增加的需求。此種狀況下很快就會引起以處理數據和流分析爲處理方式的轉變。

 

額外的閱讀資料:

您能夠從如下出版物中瞭解有關Trill的更多信息,或者從咱們的幻燈片中瞭解更多信息pdf | pptx

Trill如今是開源的,能夠在GitHub上找到

  •  您能夠在此處經過NuGet安裝Trill二進制文件。
  •  此處提供 Trill源
  •  能夠在此處下載用於演示Trill使用的示例。
  •  能夠在此處瀏覽Trill API文檔。
  •  能夠在此處找到闡述Trill的論文。
相關文章
相關標籤/搜索