基於spark之上的即席分析-卓越性能

時間 2019-11-19

標籤基於 spark 之上即席分析卓越性能欄目 Spark 简体版

原文原文鏈接

爲探索性分析與即席分析而設計架構

YDB全稱延雲YDB：是一個基於Hadoop分佈式架構下的實時的、多維的、交互式的查詢、統計、分析引擎，具備萬億數據規模下的秒級性能表現，並具有企業級的穩定可靠表現。分佈式

YDB是一個細粒度的索引：精確粒度的索引。數據即時導入，索引即時生成，經過索引高效定位到相關數據。YDB與Spark深度集成，Spark直接對YDB檢索結果集分析計算，一樣場景讓Spark性能加快百倍。oop

1. 稽查布控場景性能

按照時間逆序排序能夠說是不少日誌系統的硬指標。在延雲 YDB 系統中，咱們改變了傳統的暴力排序方式，經過索引技術，能夠超快對數據進行單列排序，不須要全表暴力掃描，這個技術咱們稱之爲 BlockSort，目前支持 tlong、 tdouble、 tint、 tfloat 四種數據類型。性能

因爲 BlockSort 是藉助搜索的索引來實現的，因此採用 BlockSort 的排序，不須要暴力掃描，性能有大幅度的提高。測試

BlockSort 的排序，並不是是預計算的方式，能夠進行全表進行排序，也能夠基於任意的過濾篩選條件進行過濾排序。spa

詳細測試地址： http://blog.csdn.net/qq_33160722/article/details/54447022.net

300億條數據的排序演示視頻 http://blog.csdn.net/qq_33160722/article/details/54834896設計

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。