谷歌云周日宕機(jī)原因公布:原因系服務(wù)器配置變更
IT之家6月4日消息 昨日,谷歌云出現(xiàn)宕機(jī)問題,影響了谷歌內(nèi)部和外部的多項(xiàng)服務(wù),導(dǎo)致美國(guó)東部地區(qū)網(wǎng)絡(luò)擁堵,涉及谷歌云、谷歌智能應(yīng)用套件G Suite和YouTube等多項(xiàng)服務(wù),對(duì)大量用戶造成影響。
谷歌隨后表示,所有因網(wǎng)絡(luò)擁堵受影響用戶的問題已經(jīng)解決。谷歌將對(duì)故障原因展開調(diào)查,并提供相關(guān)調(diào)查報(bào)告。今日,Google官方博客解釋了事故原因。
谷歌指出,從本質(zhì)上講,昨日的網(wǎng)絡(luò)中斷是因?yàn)榉?wù)器配置更改。適用于單一區(qū)域中的少數(shù)服務(wù)器,錯(cuò)誤地應(yīng)用于多個(gè)相鄰區(qū)域的大量服務(wù)器,進(jìn)而導(dǎo)致這些區(qū)域停止使用一半以上的可用網(wǎng)絡(luò)容量。進(jìn)出這些區(qū)域的網(wǎng)絡(luò)流量試圖適應(yīng)剩余的網(wǎng)絡(luò)容量,導(dǎo)致了網(wǎng)絡(luò)擁堵。網(wǎng)絡(luò)系統(tǒng)成功 分流了過載流量,保留了對(duì)延遲敏感的流量,并丟棄了大部分對(duì)延遲不是很敏感的流量。
谷歌表示,谷歌的工程團(tuán)隊(duì)在幾秒鐘內(nèi)就發(fā)現(xiàn)了這個(gè)問題,但診斷和糾正的時(shí)間遠(yuǎn)遠(yuǎn)超過預(yù)期。收到警報(bào)后,谷歌工程團(tuán)隊(duì)就迅速確定了故障原因,但網(wǎng)絡(luò)擁堵同樣降低了工程團(tuán)隊(duì)恢復(fù)正確配置的能力,從而延長(zhǎng)了停機(jī)時(shí)間。
事故期間,YouTube全球觀看次數(shù)下降了10%,Google云存儲(chǔ)的流量減少了30%,大約1%的Gmail活躍用戶帳戶出現(xiàn)了問題。