小錯(cuò)誤釀成大禍!Facebook史上最長宕機(jī)竟是因?yàn)?..
掃描二維碼
隨時(shí)隨地手機(jī)看文章
美國當(dāng)?shù)貢r(shí)間周三,全球最大社交網(wǎng)絡(luò)Facebook及旗下多項(xiàng)服務(wù)出現(xiàn)技術(shù)故障,導(dǎo)致Facebook遭遇公司近期歷史上最長宕機(jī)。在人們的生活越來越離不開互聯(lián)網(wǎng)的情況下,這次宕機(jī)事故凸顯出了互聯(lián)網(wǎng)的脆弱性。
Facebook在周四表示,公司已經(jīng)修復(fù)了一個(gè)技術(shù)故障。這個(gè)故障導(dǎo)致Facebook及旗下Instagram、WhatsApp以及Messenger應(yīng)用出現(xiàn)長時(shí)間服務(wù)中斷。
此次中斷事故在部分Facebook服務(wù)上持續(xù)了近24個(gè)小時(shí),成為Facebook近期歷史上最長宕機(jī)事故。這次令人瞠目結(jié)舌的宕機(jī)事故在提醒著人們,即便是擁有最優(yōu)秀計(jì)算機(jī)科學(xué)家、尖端技術(shù)的世界最強(qiáng)大互聯(lián)網(wǎng)公司,也會(huì)受到人為失誤的破壞。
最強(qiáng)大公司也躲不過人為失誤
“所有大型互聯(lián)網(wǎng)公司都建立了多條防線,但是有時(shí),一名工程師犯下的一個(gè)編碼錯(cuò)誤就會(huì)影響到成千上萬臺(tái)計(jì)算機(jī),造成重大故障,”前Facebook首席安全官、現(xiàn)斯坦福大學(xué)講師亞歷克斯·斯塔姆斯(Alex Stamos)表示,“換句話說,要讓Facebook這樣的復(fù)雜計(jì)算機(jī)網(wǎng)絡(luò)重啟,非常非常困難。”
Facebook發(fā)言人表示,周三的一個(gè)“服務(wù)器配置更改”在公司網(wǎng)絡(luò)上產(chǎn)生了級(jí)聯(lián)效應(yīng)。一位現(xiàn)Facebook員工和一位前Facebook員工對(duì)此表示,這會(huì)導(dǎo)致故障不斷循環(huán),牽扯面越來越廣,無法立即修復(fù)。
這個(gè)小錯(cuò)誤釀成了大禍。Instagram用戶無法查看其他人的資料、WhatsApp用戶不能發(fā)送消息,F(xiàn)acebook主應(yīng)用上的信息流變成一片空白。
▲宕機(jī)事故集中在Facebook主要市場(chǎng)
宕機(jī)追蹤網(wǎng)站DownDetector表示,該公司收到了750萬份有關(guān)Facebook應(yīng)用的問題報(bào)告。相比之下,當(dāng)YouTube在去年10月份發(fā)生大范圍宕機(jī)時(shí),DownDetector只收到了270萬份問題報(bào)告。DownDetector衡量服務(wù)是否中斷一定程度上取決于計(jì)算用戶提交的問題報(bào)告數(shù)量。
“我們從未見過如此大規(guī)模的宕機(jī)事故,”DownDetector聯(lián)合創(chuàng)始人湯姆·桑德斯(Tom Sanders)表示,
截至當(dāng)?shù)貢r(shí)間周四早晨,F(xiàn)acebook的大部分系統(tǒng)服務(wù)已經(jīng)恢復(fù),該公司依舊在試圖弄明白這個(gè)故障是如何在其網(wǎng)絡(luò)中“興風(fēng)作浪”的。Facebook管理人員強(qiáng)調(diào)稱,這個(gè)故障并不是由入侵或者分布式拒絕服務(wù)攻擊等網(wǎng)絡(luò)攻擊引發(fā)。
小錯(cuò)誤釀成大禍
多年來,F(xiàn)acebook一直在招聘工程師,希望在幾周內(nèi)就能發(fā)布觸及數(shù)十億人的計(jì)算機(jī)代碼。“看到我的工作對(duì)這么多人的生活產(chǎn)生了有意義的影響,我很有成就感,”一位員工在Facebook“求職”(careers)招聘網(wǎng)站上推薦Facebook工作時(shí)稱。
但是,這也意味著一位員工的錯(cuò)誤就能造成影響廣泛的后果,尤其是在Facebook近期制定詳細(xì)計(jì)劃合并“應(yīng)用家族”基礎(chǔ)設(shè)施之際。一個(gè)計(jì)算機(jī)網(wǎng)絡(luò)交織地越緊密,小的技術(shù)故障鑄成大錯(cuò)的可能性就越高。
和其他互聯(lián)網(wǎng)巨頭一樣,F(xiàn)acebook以“從不下線”為傲。這一目標(biāo)推動(dòng)Facebook成為了世界上最具影響力也是受到批評(píng)最多的公司之一。有20多億用戶預(yù)計(jì)每天至少在使用一項(xiàng)Facebook服務(wù)。
桑德斯稱,隨著人們?cè)絹碓揭蕾囃ㄟ^Facebook服務(wù)與家人和好友聊天,開展工作,他們對(duì)于Facebook的服務(wù)穩(wěn)定性寄予了更大希望。
“人們對(duì)于宕機(jī)事故的容忍度下降,越來越期待Facebook能夠每年365天完美無缺地運(yùn)行,”他表示。 企業(yè)受沖擊更大
盡管宕機(jī)事故激怒了許多用戶,但是它對(duì)依賴Facebook網(wǎng)絡(luò)創(chuàng)收的企業(yè)造成了更緊急的后果,例如廣告。
廣告公司GroupM社交業(yè)務(wù)全球主管凱伊莉·泰勒(Kieley Taylor)表示,她的公司無法訪問Facebook系統(tǒng),這意味著新的廣告活動(dòng)被推遲。“宕機(jī)從來不是好事,”她表示,“幸運(yùn)的是,它持續(xù)的時(shí)間相較短,但卻是全面宕機(jī)。”
她的公司依舊在設(shè)法確定有多少廣告活動(dòng)受到了宕機(jī)事故的沖擊。泰勒表示,由于Facebook廣告系統(tǒng)采用在現(xiàn)收現(xiàn)付制(Pay-As-You-Go),所以GroupM不必要求Facebook為尚未兌現(xiàn)的廣告活動(dòng)退款。
GroupM把廣告轉(zhuǎn)移到了谷歌搜索、YouTube以及其他網(wǎng)站上,但表示鑒于Facebook的用戶規(guī)模,該社交網(wǎng)絡(luò)擁有獨(dú)一無二的受眾群。
“由于所有人都在這個(gè)平臺(tái)上,F(xiàn)acebook仍舊是一個(gè)真正強(qiáng)大的數(shù)字營銷平臺(tái),”泰勒表示。