有150臺伺服器,怎麼運維

時間 2021-05-10 12:20:56

1樓:

樓主一定先要明確自己的工作職責,既我在這個團隊裡扮演什麼樣的角色?

樓主既然提到了伺服器,那我簡單先分個類

1.機房運維:硬體採購(伺服器,網路,存貯),配置,上架,巡檢,報修,監控等等(入門)

2.系統運維:負責OS,資料庫,中介軟體,應用的交付&維護等等(大部分)

上述都在scope裡還就我乙個人?再見...

由於輸入資訊不足,姑且認為樓主是系統運維吧。

樓主著重提到了「150臺」這個數量詞,那感覺就是「150臺我要一台一台弄,還能玩?」

這樣確實不能玩

如果能夠自動化就能玩了

我看很多答主也提到了自動化的工具,比如Ansible, SaltStack, Puppet, 當然還有最近大火的Terraform等。這些都是很棒的自動化工具,都能滿足題主簡單管理150臺伺服器的要求(批量操作)。

但要達到中高階的自動化,那麼光依靠這些還不夠,需要其他的元件一起配合。建議樓主可以先從這150臺伺服器環境的梳理開始,盡量朝標準化靠攏。有可能一開會比較累,但越到後期,越會顯現出對應的價值。

老生常談

標準化 + 流程化 => 自動化

標準化,流程化的成熟度,直接限制了自動化的高度。

標準化,流程化——同樣交付一台LAMP伺服器,由於每個人想法不同,習慣不同,最終成果也是「貌合神離」。試想,150臺伺服器,如果伺服器的配置,引數,元件都不一致,那自動化工具的帶來的價值也就推推檔案,執行執行簡單命令了。

2樓:哎呦喂

150臺的量,感覺不好回答,畢竟我沒運維過這麼少的伺服器。

說正事,我覺得要考慮更多情況而不是數量。比如,運維人員是否長期持有口令,公司是否允許設ssh信任關係,是否允許引入salt stack。很多公司在安全上有嚴格的限制,除了上述,可能還有SOD管理。

3樓:網際網路老辛

猜測是培訓機構學員要找工作來尋求方案了。

如果是的話,說明你是個聰明的學員,思維敏捷,活躍, 一定可以找到乙份好工作。

如果不是的話,建議補充一下你們公司的業務,和伺服器具體的場景,才能明確怎麼運維。

不管是不是,給你個建議。

先明確公司的業務,以及在現有公司業務的情況下會用到哪些技術棧。

比如電商業務,直播業務,亦或者是大資料公司,傳統業務公司,架構都不一樣,運維關注的側重點不一樣。

技術上就算這150臺伺服器上架,貼標籤,裝系統,監控,報警,日誌,到自動化,虛擬化,你乙個人都能搞定,公司也會在招聘乙個人,因為誰也不能保證你晚上睡覺不關機,或者處理緊急問題的時候不去廁所。

總不能遇到問題,就大家等著你上廁所回來搞吧(題外話,哈)

最基礎的手工運維,平時巡檢全靠指令碼和計畫任務,資料庫備份也可以用指令碼,沒啥問題。

半自動化階段: 可以使用自動化工具,比如pssh, puppet,satlt , ansible 等。 上線可以使用jenkins,日誌分析使用ELK。

自動化階段: 設計到一些產品的二次開發,比如使用CMDB。

之前面試過很多人,問他們離職原因,很多人的回覆通常是,我們公司比較小,發展受限,學的東西比較少。

其實,就算你們公司小,自動化也是可以搞的,既然沒有實現自動化,怎麼能說你沒的科學呢。 及時只有十幾台伺服器,你搞好了自動化,也是一種經驗。

4樓:

根據需求來定,每個公司都不一樣。一半這點伺服器,搞一些自動化指令碼,ansible 都可以不用,再加上乙個excel把機器資訊,服務資訊,業務資訊梳理清楚就夠用了

5樓:大可不加冰

要把伺服器當牲口而不是寵物

6樓:郎少龍

本人之前運維過2,300臺左右的機器,運維的過程也有點進化的感覺:

1.第一階段,那時候剛接觸shell,知道有個ssh,可以登入到遠端的機器,然後寫了個for迴圈的指令碼直接通過讀取配置的形式去批量執行命令、拉取資料,修改檔案等等,平時重啟伺服器也是。

2.第二階段就有了anbisle,puppet,saltstack之類的整合工具執行了,這個其實跟ssh也差不多,好處就是整合度更高了,不用自己寫太多的配置。

3.第三階段就是用Jumpserver,所有機器都歸根於一台伺服器管理,這個比ansible之類的整合工具更好,用起來會比較省心,特別是使用者授權等等。

7樓:我們與惡的距離

150臺伺服器屬於少量的小規模運維場景。

首先,梳理cmdb資產資訊,沒有線上平台用excel也可以。

其次,建設監控平台,覆蓋到硬體、作業系統、應用軟體、網路各個維度。

再者,覆蓋自動化指令碼或平台,將日常維護工作自動化處理。

最好,編制一系列管理規範及運維流程,不斷修正變成自己思想落地的產物。

如何批量管理自動運維100 臺伺服器?

行雲管家 現如今的網路環境已不同往日,雲計算時代的到來,計算資源的獲取不再是依靠本地伺服器或IDC,能提供彈性計算資源的 雲計算 已深入萬千行業之中,那麼管理這100 伺服器,是不是有公有雲的同時,也有自家的私有雲呢?雲管平台CMP的到來,不僅解決了傳統的運維問題,也解決了多雲 混合雲統一納管的問題...

乙個運維可以管理4萬台伺服器嗎?

重置之後又重置 可以啊,我們管他叫領導,他乙個人帶領100多人的團隊管理4W多台伺服器。另外如果錢多,買個幾萬臺雲伺服器也算是他管理麼 話說這個不算多,隨便乙個資料中心就得5 6k的機櫃,一般運維也就20人左右,稍微接觸些就能外面說自己搞過多少萬節點,參加過什麼重大活動。刷存在感唄,到頭來都是公司的...

伺服器集群和一台伺服器有什麼區別?

泰海 美玲 出現任何故障,如 硬碟 記憶體 CPU 主機板 I O板以及電源故障,執行在這台伺服器上的應用就會切換到其它的伺服器上。集群系統可解決軟體系統問題,我們知道,在計算機系統中,使用者所使用的是應用程式和資料,而應用系統執行在作業系統之上,作業系統又執行在伺服器上。這樣,只要應用系統 作業系...