如果把谷歌數(shù)據(jù)中心的數(shù)據(jù)都用打孔卡存起來(lái)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
提問(wèn):如果所有的數(shù)據(jù)都用打孔卡存起來(lái),那么Google 的數(shù)據(jù)中心將有多大?-- James Zetlen
小編先在這里介紹一下「打孔卡」這個(gè)老怪物:打孔卡,也叫「穿孔卡」(IBM 卡),利用卡紙上打孔來(lái)記錄信息。它看上去就是這個(gè)樣子:
這是一枚80列的標(biāo)準(zhǔn)矩形 IBM 打孔卡。
這里牽涉到一段計(jì)算機(jī)誕生的前史。要說(shuō)現(xiàn)在計(jì)算機(jī)的老祖宗,嚴(yán)格來(lái)講不是教科書(shū)上大名鼎鼎的 ENIAC,而是1801年,法國(guó)人雅卡爾發(fā)明的織布機(jī):
看到它上面一條打孔紙了么,這可是世界上最早的「可編程機(jī)器」,這些孔洞記錄了要編制圖案花紋。
后來(lái)在1880年代美國(guó),美國(guó)用打孔數(shù)據(jù)機(jī)完成了全美人口普查。而制造這些機(jī)器的這家公司,就是后來(lái)的 IBM。1890年到20世紀(jì)初期,這種打孔數(shù)據(jù)記錄的方式,一直廣泛沿用在商業(yè)領(lǐng)域和計(jì)算機(jī)編程上。(via 維基百科)
幾乎可以肯定的是,Google 擁有比地球上所有其他機(jī)構(gòu)更強(qiáng)大的數(shù)據(jù)存儲(chǔ)能力。
Google 對(duì)于他們的運(yùn)維細(xì)節(jié)守口如瓶,所以我也很難確定數(shù)據(jù)中心的具體的數(shù)字。只有少數(shù)機(jī)構(gòu)擁有可信的大型數(shù)據(jù)存儲(chǔ)設(shè)施。比如以下幾家特別厲害的:
· NSA(美國(guó)國(guó)家安全局,最近比較衰)
· NRO(美國(guó)國(guó)家偵查局,不太出名,管間諜衛(wèi)星)
· NGA(美國(guó)國(guó)家地理空間情報(bào)局,不太出名)
· CIA(中央情報(bào)局,電影里總是出來(lái)給主人公搗亂的)
· Schlumberger(斯倫貝謝,石油勘探技術(shù)公司)
· Tencent(騰訊,珠寶商)
· Chevron(雪佛龍,石油公司)
我們還要榮譽(yù)提名這些:
· Amazon(它們真的很大,但未必有 Google 大)
· Facebook(它們正在變大的道路上,而且速度很快,但還需努力)
· Microsoft(它們有百萬(wàn)臺(tái)以上的服務(wù)器(鮑爾默自己說(shuō)的),但是沒(méi)人知道他們要這么多服務(wù)器干嘛)
以錢(qián)推算
我們先通過(guò)錢(qián)數(shù),來(lái)推算 Google 有多少數(shù)據(jù)中心。Google 在基建上的開(kāi)銷——加起來(lái)大概超過(guò)120億美金。最大的一個(gè)數(shù)據(jù)中心花掉了大概5~10億美金。所以,他們不會(huì)擁有超過(guò)20個(gè)這樣的數(shù)據(jù)中心。
在 Google 的網(wǎng)頁(yè)上提到了它們?cè)谝韵聨滋幗ㄔ炝藬?shù)據(jù)中心:
· 南加州的伯克利郊區(qū)
· 愛(ài)荷華州的康瑟爾布拉夫斯
· 佐治亞州的亞特蘭大
· 北卡羅來(lái)納州的勒諾
· 俄勒岡州的達(dá)爾斯
· 中國(guó)香港
· 新加坡
· 中國(guó)臺(tái)灣
· 芬蘭哈米那
· 比利時(shí)的圣吉蘭
· 愛(ài)爾蘭的都柏林
· 智利的基利庫(kù)拉
另外,Google 還控制著其他一些大型數(shù)據(jù)中心(通過(guò)附屬公司)。
· 荷蘭的埃姆斯哈文
· 荷蘭的格羅寧根
· 波蘭的弗羅茨瓦夫
· 弗吉尼亞的雷斯頓
· 還有在佐治亞州亞特蘭大的一些數(shù)據(jù)中心
· 還有更多遍布世界的上百個(gè)小型數(shù)據(jù)中心。
依耗電量推算
搞明白 Google 有多少數(shù)據(jù)中心,還可以看看它們的耗電量。不幸的是,我們不能直接去中心看電表的走字。我們只能自己挖點(diǎn)料。
在2010年,Google 透露了他們一年要耗費(fèi) 258 兆瓦的電力。這能跑多少服務(wù)器呢?
我們知道 Google 的數(shù)據(jù)中心還是很省電的,用在散熱和其他方面的開(kāi)銷只占總用電量的10%~20%。為了解每臺(tái)服務(wù)器的耗電量,我們研究一下他們2005年提出的「集裝箱數(shù)據(jù)中心」的概念。雖然不是很清楚他們具體如何利用這些貨柜——可能現(xiàn)在看來(lái)已經(jīng)有點(diǎn)過(guò)時(shí),但可以從中估計(jì)出一個(gè)合理的數(shù)字,答案是每臺(tái)215瓦。
由此推算出,他們?cè)?010年大概運(yùn)行著100萬(wàn)臺(tái)服務(wù)器。
基于數(shù)據(jù)中心的耗電量和開(kāi)銷,我猜 Google 現(xiàn)在運(yùn)行著的——或者馬上就要達(dá)到的服務(wù)器總數(shù),在 180萬(wàn)~240萬(wàn)臺(tái)左右。
但是「服務(wù)器」究竟指什么?Google 可能弄出各種配置的各種奇葩裝備,可能一臺(tái)有100核的 CPU,還掛著100個(gè)硬盤(pán)。我們假設(shè)每臺(tái)服務(wù)器上平均掛著幾個(gè)(2~5個(gè))2T 的硬盤(pán),那總共就是 10EB(艾字節(jié) exabytes) 的數(shù)據(jù)量。
只有 10EB ?
地球上的商用硬盤(pán)廠,一年大概造出 8EB 的硬盤(pán)。但是這個(gè)數(shù)字不包括像 Google 這樣的公司,但無(wú)論如何,Google 吞掉了一大塊硬盤(pán)消耗量。
讓事情聽(tīng)上去更帶勁一點(diǎn),就 Google 用掉的這么多硬盤(pán),平均每分鐘就要掛掉一個(gè)。但這對(duì) Google 來(lái)說(shuō),根本就不算什么事兒,在它們這個(gè)體量級(jí)別的大背景下,Google 的 IT 小哥換硬盤(pán)的本事已經(jīng)爐火純青——不過(guò),我也好奇, Google 程序猿是怎么看待當(dāng)他們?cè)谝慌_(tái)機(jī)器上跑代碼,分分鐘可能碰到硬盤(pán)事故的。
磁帶上的 Google
當(dāng)然,以上只涵蓋了滾燙在線干活的硬盤(pán)。誰(shuí)知道在 Google 的地下室還有多少冷冰冰的磁帶機(jī)備份呢?
在2011年一次與 博客 SMB Tech 的作者 Paul Mah 的電話訪談中,來(lái)自 Tandbery Data 的 Anderson 透露了 Google 是世界上最大的磁帶機(jī)買(mǎi)家,一年要采購(gòu) 200,000 盤(pán)。假設(shè)這幾年,它們的采購(gòu)數(shù)量還在增長(zhǎng),所以,還得算上磁帶機(jī)的這幾個(gè) EB 才行。
算總賬
我們假設(shè),Google 擁有 15EB,或者 15,000,000,000,000,000,000 字節(jié)的數(shù)據(jù)量(小編:@_@ 我都數(shù)不過(guò)來(lái)了)。
一張打孔卡片可以存儲(chǔ)80個(gè)英文字符,然后一箱子打孔卡可以裝上2000片:
“四盒子打孔卡對(duì)任何人都?jí)蛴昧?rdquo;
15EB 的打孔卡,足夠掩埋我所住的地方:新英格蘭,足足堆上 4.5公里厚。這是上一次冰河世紀(jì)冰蓋厚度的3倍多。
看上去很壯觀吧。
然而,這和一些報(bào)道中對(duì) NSA 在猶他州的數(shù)據(jù)中心的離奇描述,還不算什么!
NSA 的數(shù)據(jù)中心
NSA 正在猶他州蓋一座大數(shù)據(jù)中心。新聞里宣稱,它們可能造出個(gè) 1YB 的怪胎,這實(shí)在太尼瑪離譜了!
最近的報(bào)道里,新聞編輯們似乎心智恢復(fù)正常了一些,又說(shuō)整個(gè)項(xiàng)目可能只有3~12EB 的樣子。并且,我們知道整體耗電量在65兆瓦左右。和 Google 的一個(gè)大號(hào)數(shù)據(jù)中心差不多。
還有一些缺少常識(shí)的標(biāo)題黨,毫無(wú)根據(jù)地吵吵說(shuō),NSA 的新機(jī)房可能存上「1EB~1YB 之間」的數(shù)據(jù)……就好比說(shuō):「目擊者稱看到一條1毫米~1公里長(zhǎng)的蛇?!?/p>
再爆一些 Google 的料
挖掘 Google 運(yùn)維的秘密還有一些技巧。諷刺的是,其中很多要依賴 Google 自己的搜索引擎才行——比如從搜索 Google 又在哪些奇怪的城鄉(xiāng)結(jié)合部招人了,到用圖片搜索被手機(jī)不小心拍到的數(shù)據(jù)中心的照片。
然而,找到 Google 秘密數(shù)據(jù)中心的最妙的技巧也許是一位 Google 前雇員,在 reddit 的「天才小丑吧(talentlessclown)」里爆尿的:
要找到 Google 的秘密數(shù)據(jù)中心,最好的辦法就是問(wèn)問(wèn)出租車(chē)司機(jī)和披薩快遞小哥。這件事情確實(shí)非常有趣。Google 已經(jīng)建立了歷史上,地球上最老練的信息搜索匯聚的機(jī)器……但知道這些機(jī)器所在的人,只有那些的哥和披薩小哥。
螳螂捕蟬,誰(shuí)在其后?
當(dāng)然是,達(dá)美樂(lè)(披薩商:Domino's)。
騰訊是“珠寶商”沒(méi)錯(cuò)哦,天天賣(mài)"鉆石"!