什麼是大資料的主流框架？

1樓：成都加公尺谷大資料

1、Hadoop

Hadoop 是採用了 Map Reduce 的一種分布式的計算框架，它是根據 GFS去開發了 HDFS 分布式檔案系統，還有根據 Big Table 開發了 HBase資料儲存系統。可以了解到的是，Hadoop 的開源特性成為了分布式計算系統事實上的國際標準。

2、Spark

Spark 是一種存在在 Hadoop 的基礎上進行了一些改良。Spark 和Hadoop 有一些區別，在於Hadoop它是使用硬碟來作為儲存資料的，而Spark 則是使用記憶體來儲存資料的，因此 Spark 可以提供超過 Ha?doop 大約100 倍的運算速度。

3、 Storm

Storm 作為一種 Twitter 主推的分布式計算系統。它在Hadoop的基礎上提供了乙個實時運算的特性，它可以實時的處理各種大資料流。Storm是不進行資料的收集和儲存工作的，它是直接通過網路實時的接受資料並且實時的處理資料，然後直接通過網路實時的傳回結果。

4、Samza

Samza 它是由 Linked In 開源的一項技術，它是乙個分布式處理框架，用來作為實時資料的處理，非常像Twitter的流處理系統Storm。

2樓：浪尖

大資料儲存排程，主流框架hadoop的hdfs和yarn。

大資料sql，主流框架hive和spark sql。

大資料的訊息佇列，kafka，pulsar。

大資料離線計算，spark，mr。

大資料實時計算，flink，spark。

3樓：資料一哥

主流的現在離線和實時都可以用spark。

實時計算可以使用Flink。

OLAP大資料量資料儲存可以使用GP。

訊息佇列使用kafka