睿至擁有自主知識產(chǎn)權的大數(shù)據(jù)分析平臺 Zeta (先知)系列,為企業(yè),政府提供一站式的大數(shù)據(jù)分析。睿至分析平臺基礎架構使用自身定制的Apache Ambari模塊進行超大集群的生命周期管理,根據(jù)行業(yè)用戶及自身產(chǎn)品的需要,在 Hadoop 的基礎上,整合添加Apache Flink 作為實時及離線分析引擎,使用 PrestoDB 作為 SQL 引擎,使用 Elasticsearch 作為分布式全文檢索引擎。
該平臺從最前端的數(shù)據(jù)采集加工,到離線建模和實時分析均采用橫向擴展的架構,從而保證在數(shù)據(jù)處理過程中隨著業(yè)務的增長。經(jīng)過實測:通常在20個節(jié)點的集群環(huán)境中,先知系統(tǒng)可保證入庫性能超過80000EPS,同時并發(fā)查詢超過1000TPS。
先知系統(tǒng)數(shù)據(jù)分析處理流程: