如何看待阿里雲在Sort Benchmark 2023年排序競賽上打破記錄和其意義?

時間 2021-05-30 20:34:45

1樓:桂能

這麼多機器,100t,可以塞進記憶體去了,我覺得阿里應該還能做的更快點的,比如用bsp跑跑,但是估計阿里會慢慢玩這個遊戲,一直霸榜

2樓:尼不要逗了

與其一群人在這兒猜測,不如我們去官網看一下資料。

我這裡只擷取了Gary測試集。

首先看下節點數目,阿里飛天使用了3134個節點,2023年的TritonSort使用了186個節點,Baidu使用了982個節點,Apache Spark使用了207個節點。正如阿里雲的志神說的,「節點數多,並不一定會提高速度,節點數越多,節點之間的同步就越耗時」,可能節點多並不能代表什麼。但是仔細想一想會發現各個節點之間的資料在排序過程中應該是不需要同步的。

對於這塊不是很懂,還請專家指導。

記憶體。阿里飛天有96G和128G。和2023年的其他幾家比較一下,顯得記憶體不大。

硬碟。阿里使用SATA硬碟,其他使用SSD較多。差異不太懂,不評價。

最後,我上面只是擺資料,因為看到前面結果回答要資料,還希望更專業的人來做乙個評價。

//吃了志神一彈弓,好傷。。。

3樓:hearts zh

只能說明一件事:阿里的商用系統,在某些應用下,比spark開源系統,快幾倍。

但阿里拿著自己商用系統,比開源spark類快幾倍並不能說明什麼問題。畢竟scala是jvm,阿里是c/c++(猜測),並且根據排序應用調優和不調相差很大,硬體好壞相差也很大,中間步驟多幾個IO就下來了,記憶體少點,速度也下來了。。

公司有錢,按照類似框架,用c/c++重新實現一下,記憶體加大一點,對排序演算法調優一下,甚至穩定性可以不考慮(宕機什麼的不管,完全沒有中間磁碟備份等),跑快spark幾倍並不是什麼很驚訝的事情。

但在所有人都用開源的時代,阿里自己做了,也說明了一些事情和一些情懷。

說句題外話,話說阿里的oceanbase 0.5怎麼還沒開源啊,是不是不開了啊。

如何看待Gartner報告顯示,阿里雲在公共雲亞太市場份額第一?

1.這個資料報含了中國大陸,結合aws在中國受到的待遇,為什麼會有這樣的排名明白人都知道。2.阿里雲在除中國外,亞洲其他國家的那點規模真的好意思拿出來和aws比嗎?心裡真的沒逼數?3.阿Q式的勝利少一點,追趕FAG的路還漫漫,別盲目慶祝。 大白兔 利益相關 前某阿里雲競品 亞太區的資料要分開中國和非...

如何看待阿里雲 位元組跳動 Cocos uni app 陸續推出 雲開發 服務?

i5ting 本質上,Serverless和node並沒有區別。核心是基於雲原生架構帶來的所謂0運維,自動擴縮容的便利。所以Serverless對前端來說就是提效。幫開發提效 更輕量級的開發模式 對外包等安全把控 為搭建 智慧型化等賦能 至於是不是雲開發,不重要。趨勢是大家有個瀏覽器就能搞定所有事兒...

如何看待阿里雲官網改版

its斯弟文 個人而言,對標國內幾家主流雲廠商的頁面設計,從配色和互動的角度最喜歡阿里雲。尤其是改版後的白橙色設計,更加溫馨親民,直接拉進了技術與企業,技術與人之間的距離。同時,阿里雲的幫助文件以及頁面串聯都做的非常好,非常適合初次接觸雲計算的人群。且目前其他廠商基本還使用藍黑白的科技風。這樣的色調...