如何評價讓大資料元件執行在Kubernetes Docker中這件事?

時間 2021-05-07 02:25:53

1樓:王sir說大資料

效能會有一定的影響,但是打通了開發,測試和運維的壁壘,極大的提公升了工作效率。

典型的DevOps思想到實踐的落地。

降低了低端運維的人數,提高了高階運維的人數,運維人員定位問題,又多了一層。

2樓:

k8s目前有兩個難解決的點:

1.有狀態服務不好做 (能做,但在國內落地的少)

2.docker對效能或多或少有些損耗

hdfs、hbase這種儲存系統,甚至訊息佇列kafka,都是有狀態的。決定了他們上k8s很難。

hbase、kafka甚至mysql此類系統,又常用於生產系統,對SLA,latency要求越快越好,因此直接用物理機符合讓業務更快這個終極目標。

如果在「對SLA」要求不高的場景,把hbase、kafka、mysql上k8s也未嘗不可。國內也有些公司這麼做了。

另外計算類框架,基本都是無狀態居多。spark/flink目前都出了run on k8s的版本。

就說這麼多把。

3樓:網易數帆

分享一下大豬廠基於 Kubernetes 和 Docker 構建構建猛獁大資料平台機器學習模組(內部代號Dolphin )的一些思考。

Dolphin 基礎設施中包括了 GPU 和 CPU 的混合計算服務節點,通過 Docker 對多種機器學習框架、使用者開發環境進行例項化和執行,通過 Kubernetes 提供計算集群的部署、維護、 擴充套件機制等功能,計算框架主要是 Tensorflow。

Why Tensorflow on Kubernetes?

如果讓資料科學家直接使用 Tensorflow,他們會遇到例如租戶隔離、資源隔離、網路隔離、難以指定 GPU 進行任務排程等等一系列軟體工程問題。

資源隔離:Tensorflow 資源無法隔離

,Kubernetes 提供租戶隔離,容器資源隔離和網路隔離等多種機制

GPU 排程:Tensorflow 缺乏 GPU 資源的排程

,Kubernetes 1.4 開始支援 GPU 排程

程序管理:Tensorflow 存在程序遺留問題、無法區分正常完成還是故障退出

,Kubernetes 提供容器生命週期管理,程序和容器共生死

伺服器定位

監控:Tensorflow 不方便日誌檢視

,Kubernetes 提供了較為完善的 Monitoring 和 Logging 功能

儲存:Tensorflow 存在訓練資料和模型儲存問題

,Kubernetes 支援對接 Cephfs,GlusterFS 等 Read 效能更好的分布式儲存系統

多框架支援:通過定製化開發 Kubernetes 的 Custom Resource 和 Operator 介面支援 MXNet 等其他機器學習框架

當然,基於當時兩個專案在任務管理方面的實際進展,團隊也做了相應的優化:

開發了基於佇列的任務排程系統,解決了 Kubernetes 沒有佇列服務的問題

開發了計算節點的 GPU 監控服務,解決了 Kubernetes 目前無法監控 GPU 的資源使用情況的問題

開發了 Kubernetes 中訓練服務的引數服務的生命週期管理模組,解決了 Tensorflow 的引數服務在訓練完畢無法自我關閉的問題

最後,Dolphin 可以根據資料科學家選用的不同的機器學習演算法框架,通過 Kubernetes 編排出相應的機器學習計算集群。

如下圖所示,通過 Dolphin 排程起來的 Tensorflow 計算集群,建立出 Parameter Server 和 Work 的 POD 以及 SVC,通過 HDFS Mount 模組將使用者資料空間對映到 Docker Container 中,執行使用者的演算法指令碼進行模型訓練和服務發布。

by 劉勛,網易大資料團隊攻城獅

4樓:職位盡量快

說個讓人討厭的答案,黑貓白貓,能抓住老鼠的就是好貓。其實這些大資料元件,可以用於資料處理和應用,也可以使用者純粹的後端應用場景,我自薦自己的專欄,讓資料能賺錢,從頭開始講資料和技術是怎麼產生價值的。

對於如何評價讓大資料元件執行在Kubernetes、Docker,其實就是自行車騎得熟練了,發現不扶車把騎車會更輕鬆一點,比彎著腰強。

如何向乙個不懂大資料的人解釋大資料

IT人劉俊明 這是乙個非常有意思的問題,作為一名教育工作者,我來說說我的看法。首先,從技術體系結構上來說,當前大資料技術已經進入到了成熟期,隨著大資料技術不斷開始落地應用,目前大資料在諸多領域已經有了比較廣泛的應用,但是要想解釋清楚大資料卻並不容易。對於普通人來說,大資料似乎離自己很近,但是似乎又離...

大資料專業的前景如何?

海牛大資料 大資料專業的前景還是不錯的。從大資料的快速落地就可以看出,大資料正在持續高速的發展。大資料目前已經覆蓋到各行各業,而且正在逐步推動傳統企業轉型公升級。而大資料人才的需求量也非常大的,人才缺口超百萬餘,隨著人工智慧 物聯網 雲計算等技術的發展,大資料人才急劇增加 大資料行業薪資普遍偏高,大...

如何評價訊飛向壁合科技提供使用者隱私大資料?

夏天 甩得一手好鍋,文字遊戲玩得一套一套的,宣告裡寫 技術濫用 不就是想說,我訊飛只是提供了技術,至於別人怎麼用我管不著嗎。那我請問你,你只是提供了技術嗎?你就沒有提供使用者個人資訊?這些資料可以隨便賣來賣去?不犯法?真心希望有關部門可以好好管管,別讓315成為一場秀,而是要落到實處,該抓的就要抓!...