客服電話:400-0755-992
客服郵箱:vip@wapadd.cn
服務(wù)時(shí)間:周一至周五 9:00-18:00
8月7日晚,針對(duì)“前沿?cái)?shù)控”數(shù)據(jù)完整性受損一事,騰訊云方面發(fā)出了文章,對(duì)事故本身從技術(shù)的角度進(jìn)行了復(fù)盤,還原了數(shù)據(jù)未丟失始末。
文章中表示,該故障緣起于因磁盤靜默錯(cuò)誤導(dǎo)致的單副本數(shù)據(jù)錯(cuò)誤,再加上數(shù)據(jù)遷移過程中的兩次不規(guī)范的操作,導(dǎo)致云盤的三副本安全機(jī)制失效,并最終導(dǎo)致客戶數(shù)據(jù)完整性受損。
對(duì)此,騰訊云強(qiáng)調(diào),其自2016年3月以來一直在提供免費(fèi)的快照功能,可以對(duì)重要數(shù)據(jù)進(jìn)行定期備份。同時(shí)出于對(duì)客戶數(shù)據(jù)隱私性和安全性的考慮,客戶可以自由選擇開啟或者不開啟這一免費(fèi)功能。騰訊云呼吁客戶開啟這一功能,進(jìn)一步提升自身數(shù)據(jù)的安全性。
界面新聞在昨日的報(bào)道中提到,7月20日20點(diǎn)左右,前沿?cái)?shù)控方面發(fā)現(xiàn),部署在騰訊云上的公司網(wǎng)站、小程序、H5突然打不開;到7月22日,騰訊云方面向前沿?cái)?shù)控確認(rèn),丟失的數(shù)據(jù)已經(jīng)找不回來。
為此,前沿?cái)?shù)控方面對(duì)騰訊云提出了高達(dá)11016000元的索賠要求,并在后續(xù)溝通中提出希望以獲得騰訊投資、騰訊官方引流等方式得到補(bǔ)償。
騰訊方面給出的補(bǔ)償措施是,補(bǔ)償責(zé)任總額不超過騰訊云公司就違約服務(wù)收取的服務(wù)費(fèi)用總額,另外提供13.29萬元現(xiàn)金作為額外補(bǔ)償。
類似的不規(guī)范操作導(dǎo)致的云端數(shù)據(jù)損壞事件,此前也曾發(fā)生在其他云服務(wù)提供商身上。今年6月27日,有用戶反饋稱,阿里云出現(xiàn)故障,MQ、NAS、OSS等產(chǎn)品的部分功能出現(xiàn)訪問異常。
阿里云在6月28日凌晨給出了故障復(fù)盤,原因是6月27日下午,工程師團(tuán)隊(duì)在上線一個(gè)自動(dòng)化運(yùn)維新功能中,執(zhí)行了一項(xiàng)變更驗(yàn)證操作。這一功能在測(cè)試環(huán)境驗(yàn)證中并未發(fā)生問題,上線到自動(dòng)化運(yùn)維系統(tǒng)后,觸發(fā)了一個(gè)未知代碼bug。錯(cuò)誤代碼禁用了部分內(nèi)部IP,導(dǎo)致部分產(chǎn)品訪問鏈路不通。后續(xù)人工介入后,工程師團(tuán)隊(duì)快速定位問題進(jìn)行了恢復(fù)。
這一系列事件的發(fā)生,實(shí)際上意味著用戶在關(guān)注服務(wù)提供商技術(shù)質(zhì)量的同時(shí),也需要提高自身的防患意識(shí)。一名大型云計(jì)算廠商的技術(shù)專家表示,云廠商提供給用戶的,并不是一個(gè)一定不會(huì)出問題的服務(wù);而是可以低成本、快速地搭建一個(gè)服務(wù)冗余、一定容災(zāi)的架構(gòu)的能力。
“用戶并不能認(rèn)為云廠商會(huì)提供100%的可用性,也需要對(duì)服務(wù)做好充分的自我防護(hù)。”這名人士說道。
當(dāng)天上午11:57,我們的運(yùn)維人員收到倉庫Ⅰ空間使用率過高告警,準(zhǔn)備發(fā)起搬遷擴(kuò)容;在14:05時(shí),運(yùn)維人員從倉庫Ⅰ選擇了一批云盤搬遷至新倉庫Ⅱ,為了加速搬遷,手動(dòng)關(guān)閉了遷移過程中的數(shù)據(jù)校驗(yàn);在20:27 搬遷完成之后,運(yùn)維人員將客戶的云盤訪問切至倉庫Ⅱ,同時(shí)為了釋放空間,對(duì)倉庫Ⅰ中的源數(shù)據(jù)發(fā)起了回收操作;到20:30 監(jiān)控發(fā)現(xiàn)倉庫Ⅱ部分云盤出現(xiàn)IO異常。
本次事故起源自因磁盤靜默錯(cuò)誤導(dǎo)致的單副本數(shù)據(jù)錯(cuò)誤,再由于數(shù)據(jù)遷移過程中的不規(guī)范操作,導(dǎo)致異常數(shù)據(jù)擴(kuò)散至三副本,進(jìn)而導(dǎo)致客戶數(shù)據(jù)完整性受損。
數(shù)據(jù)搬遷過程中的違規(guī)操作主要如下兩點(diǎn):
第一是正常數(shù)據(jù)搬遷流程默認(rèn)開啟數(shù)據(jù)校驗(yàn),開啟之后可以有效發(fā)現(xiàn)并規(guī)避源端數(shù)據(jù)異常,保障搬遷數(shù)據(jù)正確性,但是運(yùn)維人員為了加速完成搬遷任務(wù),違規(guī)關(guān)閉了數(shù)據(jù)校驗(yàn);
第二是正常數(shù)據(jù)搬遷完成之后,源倉庫數(shù)據(jù)應(yīng)保留24小時(shí),用于搬遷異常情況下的數(shù)據(jù)恢復(fù),但是運(yùn)維人員為了盡快降低倉庫使用率,違規(guī)對(duì)源倉庫進(jìn)行了數(shù)據(jù)回收。
因這些錯(cuò)誤操作的連續(xù)影響,導(dǎo)致該客戶數(shù)據(jù)完整性受損,給客戶的正常業(yè)務(wù)運(yùn)行造成影響,騰訊云對(duì)此再次表示最誠懇的歉意。
經(jīng)過技術(shù)復(fù)盤,騰訊云技術(shù)團(tuán)隊(duì)深入到每個(gè)環(huán)節(jié),通過責(zé)任到人與流程閉環(huán)的雙管齊下,相應(yīng)作出如下的加強(qiáng)和改進(jìn)措施:
首先,我們將全面審視所有的數(shù)據(jù)流程,涉及數(shù)據(jù)安全的流程自動(dòng)化閉環(huán),進(jìn)一步提升我們常規(guī)運(yùn)維自動(dòng)化和流程化,降低人工干預(yù)。同時(shí)把全流程的數(shù)據(jù)安全校驗(yàn)作為系統(tǒng)的常開功能,不允許被關(guān)閉。
其次,針對(duì)物理硬盤靜默數(shù)據(jù)錯(cuò)誤,在當(dāng)前用戶訪問路徑數(shù)據(jù)校驗(yàn)自愈的基礎(chǔ)上,我們優(yōu)化現(xiàn)有巡檢機(jī)制,通過優(yōu)先巡檢主副本數(shù)據(jù)塊、跳過近期用戶訪問過的正確數(shù)據(jù)塊等方法,加速發(fā)現(xiàn)該類錯(cuò)誤,進(jìn)行數(shù)據(jù)修復(fù)。
騰訊云自2016年3月以來一直在提供免費(fèi)的快照功能,可以對(duì)重要數(shù)據(jù)進(jìn)行定期備份。同時(shí)出于對(duì)客戶數(shù)據(jù)隱私性和安全性的考慮,客戶可以自由選擇開啟或者不開啟這一免費(fèi)功能。騰訊云在這里也呼吁客戶開啟這一功能,進(jìn)一步提升自身數(shù)據(jù)的安全性。
未來,本著對(duì)客戶數(shù)據(jù)最大的敬畏,騰訊云將繼續(xù)探索更科學(xué)的機(jī)制,避免類似事件再次發(fā)生。
客服電話:400-0755-992
客服郵箱:vip@wapadd.cn
服務(wù)時(shí)間:周一至周五 9:00-18:00
掃一掃 關(guān)注微加
Copyright © 2021 WapAdd.cn 深圳微加互聯(lián)科技有限公司 粵ICP備14021220號(hào)-1 建站加盟首選,微加建站! 粵公網(wǎng)安備 44030402001656號(hào)
圖片與文章來源于網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)與我聯(lián)系刪除。