pentaho,Kylin, Mondrian, Saiku之間到底是什麼樣的關係?

時間 2021-06-06 03:02:41

1樓:西樓

今天剛在查關於 Mondrian和Saiku的資料,而kylin則是前段時間一直在使用的,查了一下午,大概對這些東西有個了解了。

首先kylin 的多維分析包含如下步驟:

1.建立資料模型(指定事實表、維度表、維度、度量等)。

2.根據資料模型建立資料立方體cube.

3.構建cube,kylin會根據你建立的模型和cube來對整個維度和度量各種能夠出現的組合進行計算,這是kylin的核心,預計算!計算好後計算結果直接儲存在hbase.

4.kylin 開放出sql查詢介面供我們查詢,表面上看我們的sql跟以往查詢關聯式資料庫並沒有什麼不同,但是底層的查詢實際上已經不是在原來的事實表和維度表去查詢,而是去hbase直接找你預先計算好的結果,這也就是為什麼kylin能保證在億級資料毫秒級返回,因為他把你想要的資料都算好了,只是取出來而已,而你構建cube時沒有指定的維度的查詢則查詢不到,因為他沒算。

Mondrian 則是乙個多維分析引擎,他也需要你提前建立模型,然後在你查詢的資料的時候根據你的查詢語句(MDX)和建立的模型,也對資料進行各個角度,各個維度的分析計算,然後把資料返回。所以區別的重點就來了,Mondrian 是引擎,他幫你計算,但並不是預計算,那Mondrian 返回的結果怎麼展示呢,畢竟是各個維度各個層次的。

Saiku 則是用來展示Mondrian 計算出的資料的地方,同事saiku裡面已經整合了Mondrian ,Saiku是一套完整的從分析處理到展示的解決方案 。

kylin是一套分析處理並儲存的解決方案,kylin並不提供多樣化的展示,下鑽,他提供出jdbc一樣的介面,怎麼展示取決於你。

所以就像 @亦行亦思 說的一樣,saiku可以和kylin結合起來,因為Mondrian 並不是預計算,所以在大資料的表現上會很差,那麼讓Mondrian 直接去處理kylin已經儲存好的資料不就解決這個問題了。

就是這樣,對於Mondrian 和saiku我也是一知半解,就今天看了一下午,kylin則是用了兩三個月,還算有點了解。

2樓:亦行亦思

Apache Kylin是基於Hadoop的OLAP引擎,它的技術特點是能夠充分利用Hadoop集群的MapReduce/Spark技術進行分布式的資料立方體預計算,並提供強大的高併發支援能力,能夠響應標準SQL的訪問請求。Kylin是MOLAP引擎,也就是說除了包括多維立方體模型,還包括多維立方體的預計算的實際資料。

Saiku是一款開源BI前端工具。Mondrian是其內部使用的乙個開源ROLAP引擎,ROLAP的元資料僅僅包括了多維立方體模型,而不包括實際的立方體資料,因此適合小規模資料。

當資料量達到億級,為了能夠提供高效能的查詢,Saiku可以直接連線Kylin的資料來源,傳送標準SQL查詢語句,然後Kylin會從資料立方體中直接找到對應的結果返回給前端,速度能達到秒級或者亞秒級,非常適合大資料應用。

唐朝長安城到底是什麼樣,坊到底是什麼樣的?

ISJOY LIVE 簡單看了下,多數的回答是講唐代長安的皇城,當然題主問的嚴格說也是長安的皇城,而非長安城,所以就簡單說下,當年整個長安城南北長8651公尺,東西寬9721公尺,全長約36.7公里,相當現在西安城的10倍 參見王崇煥中國古代交通 現在西安的城牆基礎是明代在唐代皇城基礎上修築的 參見...

感情到底是什麼樣的?

泡芙裡你的樣子 是蜜橘,是太陽,是早起的雨露,是水裡自由的魚,是遮風擋雨的大山,是涼亭裡的一盤棋,是星星追逐月亮,是乙個人的愛好,是熱情的恰恰,是你眼裡的星光,是乙個人準備付出的真心 護法居士 是時尊者阿難獨止一處。於夜分中心生思念。諸緣生法其義甚深難可了解。惟佛世尊。具正遍知善能宣說。作是念已。至...

菲律賓到底是什麼樣的?

Alina 女 基本都是未婚先孕拖著幾個孩子還在尋找真愛最好能找個有錢的白人接盤 男 不負責任基本都是瞞著有私生子女這事在外面到處找女生特別喜歡找中國和日本女生下手 之乎者也 貧富差距巨大的國家,富人區的治安和景色環境還不錯,但很多地方環境真的是髒亂差例如中國城被稱作貧民窟,汽車尾氣,汙染的水質,路...