如何評價微軟的 R Server?

時間 2021-06-01 19:54:14

1樓:依山

微軟的R Server其實是對開源R從研究角度向工業生產角度的一種努力。

微軟的R其實包括了微軟R Open和R Server。 ROpen是基於開源R的乙個改進實現,對開源R從底層基於MKL提供了多執行緒的支援。RServer其實主要有兩個最重要的功能,第乙個是分布式,第二是DeployR,也就是部署。

RServer能夠支援分析任務執行的時候,資料能夠從磁碟讀取,不需要在任務開始時就把所有資料載入到記憶體。在這個基礎之上,R Server就可以通過多台機器協同工作進行分布式的R分析任務。這個支援是通過ScaleR完成,並不是所有的開源R包都能實現分布式。

DeployR主要是指開發完R指令碼之後可以通過簡單的Publish Service就把R發布成web服務提供服務,不需要額外的開發和運維成本。

目前R Server通過三種模式提供R Server的服務。

第一種是在物理機或者虛擬機上安裝R Server, 這種R Server可以提供Web結點和Compute 結點,其中Web結點用來發布模型提供Web 服務,Compute Node則主要用於計算。這兩種Node是邏輯概念,可以部署在同一物理機上。多台機器可以組成R Server的服務集群,應對大量請求和Fail Over,通過DeployR發布web服務主要推薦這種方式。

第二種是在Azure上將HDInsight集群和R Server結合, 在Spark的基礎之上提供R的分析能力,在這種模式,HDInsight提供了Edge Node作為R的開發環境,開發完成的Rscript可以直接通過rxSetComputeContext切換到 Spark Context在Spark的大資料集上分布式執行。執行結果可以通過DeployR發布在Edge Node或者其他R Server集群上。 Edge Node的發布不具備fail over的能力。

第三種就是SQL Server +R 的模式,這種模式可以把完成開發之後的Rscript嵌入到Sql Server的儲存過程中,通過儲存過程呼叫的方式對SQL server資料進行分析,簡化了資料移動和處理的過程。在Sql Server上執行R也能支援ScaleR, 但是目前ScaleR的高效能和分布式只有企業版支援,其他版本相對較低。

總體來說,R Server解決的是開源R在大資料量分析以及運維部署的一些不足,瞄準的資料科學從研究實驗向工業應用轉變中的痛點。

如何評價微軟的硬體設計?

胖胖滑鼠手感非常好,手已經變成胖胖滑鼠的形狀了,已經是胖胖滑鼠的人了 然後 它的接收器壞了有七八次了吧,有的時候自己去換,然後稍不留神搞丟了憑據就沒辦法了,這接收器是我用過壞過的最多的 但滑鼠本身又幾乎離不開了 太可怕了 更新 最後發現是 macbook 的 USB 介面的問題。 狼大人 前後兩年產...

如何評價微軟Xbox Series S的設計

醜爆了好嗎,根本就沒有設計,隨便找個外包公司就能設計出來的東西,竟然還有人吹微軟設計,這方盒隨便找個華強北的設計都比它強,真搞不懂就這麼廉價明顯沒當回事的設計也有人吹,這些人是真傻,還是收了微軟錢了? 我覺得挺好,真的挺好,極簡的設計,只追求功能的實現,不在奇奇怪怪的地方瞎花錢。我見過很多所謂 網路...

如何評價微軟宣布「無論之前使用者使用的微軟作業系統是否是盜版,都可以通過合作夥伴獲得公升級windows 10」?

windows就像一輛車,微軟目前主要靠收團體票掙錢,散客逃票上來,人家也睜一眼閉一眼,有人說既然睜一眼閉一眼為什麼不直接免費了,微軟說愛坐坐,不坐也不攆你走,你不去坐隔壁的車就好。有乘客說爺還真不坐了,真下車之後,大呼一聲,靠,我行李還在你那託運呢 微軟在下一盤很大的棋。公升級時間有一年這麼長,在...