乙個運維可以管理4萬台伺服器嗎?

時間 2021-05-07 17:31:05

1樓:重置之後又重置

可以啊,我們管他叫領導,他乙個人帶領100多人的團隊管理4W多台伺服器。

另外如果錢多,買個幾萬臺雲伺服器也算是他管理麼……話說這個不算多,隨便乙個資料中心就得5-6k的機櫃,一般運維也就20人左右,稍微接觸些就能外面說自己搞過多少萬節點,參加過什麼重大活動。刷存在感唄,到頭來都是公司的裝置,自己就是被拴在裝置上的LV。

有本事刪庫跑路啊,有本事朝核心撒泡尿啊。

2樓:張晉濤

這個問題我覺得需要將其細分來看待。

首先,對於運維而言,分類很多,比如 IDC 運維,系統運維,應用運維等。不同崗位所謂的管理其實並不一樣,工作量也是不同的。

IDC 運維實際工作內容也有細分,但整體而言,最基本的上架,通電,聯網,以及硬體和機房故障等處理還是需要做的。(如果乙個人上架&管理 4 萬台裝置,這個工作量還是很可觀的...

系統運維的話,不同公司的職能可能不同,比如主機監控,LB 的管理等。(如果說乙個人管理 4 萬台裝置,並且基礎設施/自動化相關做的很完善的話,也許還有些可能

應用運維的話,主要是需要負責業務生命週期 ,保障業務穩定。 (考慮到業務需求的多樣性,以及可能遇到的各種情況, 乙個人管理 4 萬台裝置上的應用,基本不可能了(即使是 4 萬個容器

----分隔線----

回到問題描述中的那個表述。 我覺得需要具體來看。

如果是負責經營乙個或者多個 IDC(非一線實施) , 那是否也可以表述為 」我手上有 4 萬台「?

如果是系統運維,「我手上有 4 萬台」是否可以理解為交付出去 4 萬個例項?

如果是業務運維,那大概就只能是有登入許可權的機器/例項有 4 萬台了吧....

3樓:風君子

我不信有哪個公司敢讓乙個人直接維護4萬台伺服器,就算他真的可以,公司也不敢這樣幹啊。不過4萬個例項在乙個總賬號下,由乙個人來管理許可權分配倒是有的

4樓:Karl.z

可以設想下如果4萬台伺服器放在同乙個機房,大概需要多少機櫃。

如果像國內普通的IDC機房,單機櫃不允許超電限20臺1U左右的機器,或者是1拖4,2U的那種,大概會在2000個機櫃左右。不說駐場運維(這麼多伺服器你總要考慮硬體損壞吧),光IPMI開個機可能就要幾天。

畢竟,吹一根毫毛,分出千萬個XD

5樓:Eric

我是負責IDC 運營這方面的,4萬台物理機,如果按標配2U一台來計算,乙個42U標準機櫃理論可以放置20臺伺服器,那麼4萬台就要2000個機櫃,我目前交付過最大的資料中心大概是5000個機櫃左右,這麼多的伺服器,至少需要三個團隊共同來管理,網路團隊,伺服器團隊,基礎設施團隊,每個團隊至少要配置6個人左右,所以至少要18人才能負擔的起,而且這還是極限的狀態下!伺服器硬碟出故障的概率比較大,你需要經常維護!

6樓:

大公司可能有平台支撐,招個人看著系統,有自動化工具,偶爾可能需要手動操作一下,但是這系統、自動化指令碼,又不是從天上掉下來的…管理系統、自動化指令碼也需要根據技術更新進行迭代…

還有就是穩定情況沒事,偶爾一兩個小問題處理處理,但是如果出問題,真的顧不過來…

乙個派出所能管幾個小區,但別真以為這幾個小區是因為乙個派出所才安全的,真正起作用的是背後的整個體系…

7樓:

手上有4萬台的意思可以是手上有4萬台伺服器的管理員許可權...物理機是不可能的,不然光換硬體就夠你受了,虛擬機器有可能,最可能的是容器

8樓:aiirii wong

沒有限定工作內容,責任,工作時間的都是「耍流氓」怎麼說都可以。

但如涉及到完整的生命週期,從機房環境(配電,空調等),到裝置上架,系統部署(這個大部分大公司都實現自動配置和OS部署),儲存、交換機,防火牆,備份等裝置部署和配置(當然一些公司都實現軟體化,好自動配置),裝置故障處理,系統公升級補丁,故障診斷,這些基礎設施運維工作的話,那是需要乙個完整的團隊(包括外包),平均乙個人能管理500-1000已經是管理比較厲害的公司了。

如果涉及到應用維護(不涉及開發),按我之前的企業(傳統企業非網際網路),單單乙個ERP或財務系統,不到10臺伺服器,都需要10多個IT支援人員了。

9樓:liys87x

非託管、非公有雲的情況硬體運維不可少,多少人不清楚。

軟體看自動化程度,如果自動化程度太低人再多也沒用。

平台運維 3 到 5 人,負責平台、中介軟體、及各種公共服務業務運維分攤到業務團隊,自服務

10樓:lyp

你們都太落後了,現在流行"人工智慧",乙個人已經可以管理上千萬臺物理伺服器。

鐺鐺鐺,主角上場:(及他背後的人工智慧)

ps: 這個提問將網際網路公司海量運維的牛皮刺破了。

11樓:

我覺得不能。以我司為例,伺服器雖然不到4萬,但是運維團隊已經有五六十人了。出於成本的控制,自建IDC,這就需要伺服器和網路兩個團隊來管理。

還有這麼多伺服器下運維工具,自動化要求,運維開發團隊也要幾組。還要業務運維對接業務,規範化標準化。值班運維對基礎告警進行處理以及監控相關的需求整理。

看上去投入了很多人力,但是在成本效率質量上的收益更大

12樓:安博微

結論: 怎麼可能 。

1.手上4w負責什麼?如果只是執行起來乙個人沒問題。如果只是發布也沒問題。因為寫個發布平台也完事。

2.運維涉及部分很多,中介軟體部分,安全部分,監控,發布,高可用,備份,網路,許可權控制,等等。最重要的還有很開發提的各種需求。

這只是廣度部分,還有深度部分。中介軟體原始碼級的理解,管理平台的開發等等。每個領域都可以單獨拿出來做。

3.如果只是機器上架執行起來,當我沒說。

13樓:食鐵獸

魯棒性,或者叫耐操性

別管幾台伺服器,4臺還是4萬台

乙個人,連5*8的全勤值守都難以保障

更別說這個人傷病、離職造成的空缺了

必然要乙個有一定魯棒性的團隊

14樓:

他估計是管乙個團隊,這個團隊管四萬台伺服器,四捨五入就是他乙個人管四萬台伺服器。

什麼量級的公司會需要四萬台伺服器?這種量級的公司只有乙個運維你信嗎?至少得有4-5個運維輪流值班吧?

15樓:趙毅封

4萬台物理機,就硬碟故障每天就夠忙的,數量大了,你會發現每天都在壞硬碟,如果拋開硬體的維護,只談伺服器上的應用,比如nginx,mysql,4萬台應該可以,現在都是自動化,人就給個規則,剩下的都是程式完成。

我在小公司,我們啥都幹。500臺物理機,我們每個月都要拿出一兩個整天處理硬體故障,比如硬碟,記憶體條,主機板啥的,還是全dell伺服器,很煩人。大公司怎麼處理物理機硬體問題就不知道了,也許有專人管理。

16樓:江潯

不少神吹的啊,

因為軟體會幫忙解決99.9%的重複工作

所以剩下的都會是硬骨頭

真當找你做運維就是負責看MSG填工單麼?

關鍵節點故障能多少分鐘能完成負載遷移

應用擴容多少分鐘內能達到新算力可用

應用全線公升級時如何確保服務質量

SRE:Google運維解密

Site Reliability Engineering:How Google Runs Production Systems

這本書很不錯

17樓:

因為你沒在大廠待過,我當年搞運維的時候名下也有3萬台,裝置到達一定量級之後會有配套的平台完成99.9%的自動化工作。

伺服器維修可以不查問題,直接換,發個指令給外包人員操作就行了。電腦宕機?自動重啟。重灌100臺電腦,提乙個單就完成了,流程自動完成,還覺得上萬台伺服器需要幾個人?

如何批量管理自動運維100 臺伺服器?

行雲管家 現如今的網路環境已不同往日,雲計算時代的到來,計算資源的獲取不再是依靠本地伺服器或IDC,能提供彈性計算資源的 雲計算 已深入萬千行業之中,那麼管理這100 伺服器,是不是有公有雲的同時,也有自家的私有雲呢?雲管平台CMP的到來,不僅解決了傳統的運維問題,也解決了多雲 混合雲統一納管的問題...

有150臺伺服器,怎麼運維

樓主一定先要明確自己的工作職責,既我在這個團隊裡扮演什麼樣的角色?樓主既然提到了伺服器,那我簡單先分個類 1.機房運維 硬體採購 伺服器,網路,存貯 配置,上架,巡檢,報修,監控等等 入門 2.系統運維 負責OS,資料庫,中介軟體,應用的交付 維護等等 大部分 上述都在scope裡還就我乙個人?再見...

SSL 證書,是一台伺服器只能有乙個嗎?

Gworg 不是,SSL證書是根據網域名稱簽發,可選多網域名稱 萬用字元 多網域名稱萬用字元等型別證書,這樣1個證書內就保護了多個信任網域名稱,並且可以進行統一管理,Gworg SSL證書簽發。單域型 您只有單個網域名稱需要使用SSL證書,可選擇任意一款Gworg SSL證書,購買http doma...