1樓:
這說明長期以來,人為的把程式開發和執行維護分開是沒有必要的。是一種誤解
執行維護的人員更容易導致系統問題。
因此,我認為,不應該有專門不懂程式的執行人員。所有接觸伺服器的人必須都是開發員。
2樓:batsing
多大個事兒。才幾百G,把硬碟拆出來,拿去叫人資料恢復一下不就行了。
這種小case,拿去廣州崗頂都不用一小時
資料丟了還有閒情在這裡搞直播,不是炒作還能是什麼??
3樓:YoYoRunning
這件事讓我最欣賞的是gitlab對此事的處理行為,此事的第一時間並沒有責備、開除員工,而是公開透明積極的解決問題。這樣的處理行為,必須是讚讚讚 ,這樣的公司真是網際網路的一股清流啊。
4樓:
就沒人覺得這次事故是因為雲環境幹什麼都計費導致的麼?什麼動作都計費,導致使用資源時過於節省,導致備份恢復的真實能力不夠強大。
如果是本地IDC環境,各種資源管夠,且不額外計費,想怎麼備份就怎麼備份,想怎麼加大備份強度就怎麼加大備份強度,那這次事故是完全可以避免的。
5樓:石海
關鍵不是rm -rf, 而是另外6套系統是不是正常工作,是否能正常回滾,從來沒人關心過。
關於rm 更多的建議是改成mv, 系統裡就不能有rm 命令
6樓:Hush
這一事件說明兩個問題:
天災易躲,人禍難防。所有的備份策略都應該以防止人禍為第一優先順序。
讓程式設計師去當DBA有多麼的不靠譜。一天備份一次是什麼鬼。
想想我司的SQL Azure,明明自身有4個replica,資料檔案存放的Azure Storage還自帶3個replica,根本不會丟資料,為什麼還要任勞任怨自動地每週做一次全量備份、每天做一次差量備份,每5分鐘做一次日誌備份?就是因為不停地有客戶來開Incident,「啊,我不小心drop table了」,「啊,我不小心delete *了」,「啊,我的update忘記加where了」。甚至於你不小心drop database ,在一定期限內都可以恢復。
這些都是這麼多年SQL Server的運營經驗帶來的血的教訓啊。聽說gitlab這樣的新興公司還曾經想自己搞私有雲?簡直呵呵。
7樓:木子先森
前段時間我歸集4T的資料,每次delete/update的時候,我都會先建立一張tablename_bak_date,怕的就是出問題。都是血的教訓!!!
8樓:余博倫
送大家一段定時備份資料庫的指令碼:
#!/bin/sh
DATABASE
=/backup/mysql/ #檔案備份路徑DATE
=`date '+%Y%m%d-%H%M'
`#日期格式(作為檔名)
DUMPFILE
=$DATABASE-$DATE.sql #備份檔案名DATE_N
=`date -d "-30 day" +%Y%m%d`rm -rf $DATABASE-$DATE_N*#備份資料
mysqldump 《你的資料庫名》 -u《你的資料庫使用者名稱》 -p《你的資料庫密碼》 >$DUMPFILE
#壓縮檔案
tar zcvf $DATABASE《你的資料庫名》-$DATE.tar.gz $DUMPFILE
rm -rf $DUMPFILE
9樓:Ametoki
昨天在微博上看到的,把Adobe所有軟體都裝上,刪庫時先刪A打頭的檔案,光Adobe就得刪個十分鐘吧,那時候早就反應過來了,所以說Adobe關鍵時刻能救命。
10樓:
我來答題一發。 當年剛畢業入職的一家公司,環境是mysql 主從同步的,加mysqldump備份。
我們leader手抖不知道要改什麼刪庫, 跑到主庫上去drop了一下database然後這條命令又同步到了從庫上, 然後斯巴達了,創業公司所有專案都連的這個庫, 所有的使用者資料以及各種資訊都在上邊存著。
我跟我們leader還有另外乙個同事,我們仨恢復這個庫弄了八個小時,簡直是666.
幸好有full backup,
11樓:叛逆者
其實可能是網管突發奇想想玩遊戲了,發現機器上有Intel核顯和NV獨顯,打算裝個Bumblebee搞自動切換。[大誤]
有多少人還記得,Bumblebee的安裝指令碼裡,有一行rm -rf /usr /lib/nvidia-current/xorg/xorg
作者本意是刪掉/usr/lib/nvidia-current/xorg/xorg,但因為/usr和/lib之間多大了乙個空格。。。install script does rm -rf /usr for ubuntu · Issue #123 · MrMEEE/bumblebee-Old-and-abbandoned
12樓:
據說是生產環境刪了300GB左右的資料庫,後來發現之後停了下來,然而資料只剩3.5G了
六重備份全部失效,真可以去買彩票了
13樓:黃鑫
沒有驗證的備份不叫備份。
沒有驗證的備份不叫備份。
沒有驗證的備份不叫備份。
不要搞什麼「重要操作兩個人,任何操作雙重校驗」。同學,你運維過嗎?你知道所有拍腦袋的流程、審核只是為了事後問責服務嗎?
事故中的六種備份渠道,除開daily backup,其他五種有哪怕數量比較的驗證,就不至於全盤皆輸。
14樓:
拿到電腦我一般都會這樣alias rm='i am ready to play with the fire balabala'哎,說多了都是淚
15樓:QAMichaelPeng
前幾個月俺幹過一次類似的事,晚上十點多在sql developer中手工改一行核心表的資料
update table T set status = 0
where conditions
本來按照俺的condition只會改一行的,悲催的是俺執行語句的時候手一抖,where 沒選上,然後整個資料表狀態清零......
在sql developer中auto commit是off的,可俺cancel掉執行語句之後新開乙個session, select一把,居然所有資料都更新了......
這張表直接關係著系統裡內部所有ETL job的排程,然後成千上萬不該被排程的job被排程, 工作表的資料被汙染, 無數美國和印度的SDE, DBA被page起來停job, 恢復資料
完事了寫COE(Correction of Errors), 重點有以下幾條:
盡量利用指令碼,工具等來避免人工錯誤。
盡量不要多個team更改乙個重要資料集,可以不同team更新不同的子集,再merge回mainline, 即使有誤操作影響也有限。
不要在半夜改資料!!!
16樓:天藍
感覺我看旁邊聊天是要笑屎了
不過還是希望gitlab能夠快點恢復吧
Make Gitlab great again|( ̄3 ̄)|
如何評價2023年1月19日雷霆vs勇士的比賽?
一頭霧水 怎麼說呢,勇士兩次碰雷霆小杜都資料亮眼,可能是科爾刻意要照顧小杜的感覺吧。小杜本賽季的兩個高分都是打雷霆拿的 第一場太明顯了,全隊都給小杜做球,讓他出手了24次拿了39分,比庫里和阿湯兩人的出手數加起來只少了4次 這場給他做3分球,他也神了,7投5中,拿下賽季最高分40分。小杜與庫里的關係...
如何評價 2017 年 7 月 1 日實施的《建築資訊模型應用統一標準》?對 BIM 行業有哪些影響?
BIMer王閆佳興 1 有了標準是好事,證明BIM前行的道路,指引了一條方向 2 BIM講究大資料,大平台。現在資料都是各自封閉的,何談共享。有了標準很有可能給資料的共通性撕開一條完美裂縫。現在上海有企業在研究BIM資料以及定額統一了 3 我堅信BIM技術可以改變已經跑遍的建築業。也不知道以包代管的...
如何評價2023年12月19日凱爾特人112 111戰勝步行者的比賽?
就不告訴你我是誰 很多年不看球賽了。其實是不懂籃球的,那些隊名 運動員也只是知道名字分大部分不清誰是誰。只是依然清晰的記得,2012年和2013年夏天,總決賽熱火勝了雷霆。恩,後來也再沒有出現過,讓我如此關注籃球賽的人了。 Gimli King 驚奇的發現,怎麼現在我凱的比賽,每場都有人出來問賽後了...