big data來(lái)襲 英特爾擘劃軟硬體藍(lán)圖
巨量資料(big data)無(wú)疑是推動(dòng)下一波科技業(yè)發(fā)展的關(guān)鍵,也讓所有大廠視為必須緊抓在手中的機(jī)會(huì)。因此,當(dāng)英特爾(Intel) 亞太區(qū)資料中心事業(yè)群行銷專案經(jīng)理Nick Knupffer上周來(lái)臺(tái)舉辦巨量資料媒體說(shuō)明會(huì)時(shí),第一個(gè)問(wèn)題就是“在這之前,還有誰(shuí)參加過(guò)其他廠商舉辦的巨量資料活動(dòng)?”
“每?jī)商?,我們產(chǎn)生出的資料量,便相當(dāng)于自有文明以來(lái)到直到2003年的總和,”Knupffer強(qiáng)調(diào)了今天資料產(chǎn)生的速度之快,以及數(shù)量之龐大。
“今天,中國(guó)智慧城市專案中因儲(chǔ)存產(chǎn)生的資料量,便高達(dá)200PB;RFID標(biāo)簽的銷售量,會(huì)從2011年的1,200萬(wàn)個(gè),成長(zhǎng)到2021年的2,090億個(gè);”Knupffer指出,未來(lái)幾年內(nèi),這些所謂的巨量資料,將衍生出極為龐大的商機(jī),例如“10年內(nèi),因個(gè)人位址資料而產(chǎn)生的產(chǎn)值將高達(dá)8,000億美元;未來(lái)幾年內(nèi),美國(guó)將可因善用巨量資料,每年節(jié)省3,000億美元的醫(yī)療保健費(fèi)用。”
這股巨大的資料成長(zhǎng)趨勢(shì),勢(shì)必要求IT基礎(chǔ)設(shè)施具備更強(qiáng)大的運(yùn)算、儲(chǔ)存功能,同時(shí)也意味著包含資料處理、介面和高速傳輸技術(shù)再革新的必要性,另外還包括可擴(kuò)展性,未來(lái)因應(yīng)巨量資料趨勢(shì),所有的IT架構(gòu)都必須基于開(kāi)放式架構(gòu)平臺(tái),以確保能提供良好的成本優(yōu)勢(shì),讓廠商能無(wú)縫升級(jí)。
Knupffer指出了巨量資料的幾個(gè)主要定義:首先是巨大的資料量(volume)──傳統(tǒng)資料單位是GB或TB,而巨量資料則是從PB起跳;第二是快速資料處理和動(dòng)態(tài)資料體系(velocity)──傳統(tǒng)資料進(jìn)行復(fù)雜的事件處理,而巨量資料則強(qiáng)調(diào)「即時(shí)」資料分析;第三是資料多樣性(variety)──這就需要回異于過(guò)去的軟體技術(shù),包括有能力因應(yīng)更多「非結(jié)構(gòu)化」資料處理的創(chuàng)新軟體及演算法。
巨量資料對(duì)硬體和軟體產(chǎn)業(yè)都帶來(lái)了巨大挑戰(zhàn),最大原因便在于絕大多數(shù)資料都是非結(jié)構(gòu)化,而且包含許多種截然不同的格式,當(dāng)然,還必須思考到資料本身的正確性──所有來(lái)自于人所輸入的資料,正確性達(dá)到多少?其中有多少是虛假資料?是否有演算法能夠依照所有收集到的相關(guān)資料,做出最接近真實(shí)的判斷?
目前,這些問(wèn)題都還懸而未決。但像英特爾這樣的廠商,已經(jīng)踏出了腳步。
我們可以透過(guò)更快速的CPU、儲(chǔ)存、I/O和網(wǎng)路平臺(tái)技術(shù),在硬體方面建構(gòu)適合巨量資料的硬體環(huán)境;接來(lái)來(lái),我們會(huì)陸續(xù)投入創(chuàng)新的最佳化軟體堆疊和服務(wù),去探索最適合發(fā)展巨量資料的各式軟技術(shù),Knupffer說(shuō)。他強(qiáng)調(diào),英特爾投資(Intel Capital)已經(jīng)針對(duì)多家發(fā)展相關(guān)技術(shù)的公司進(jìn)行了投資,并積極尋求建立巨量資料生態(tài)系統(tǒng)。
所謂的開(kāi)放平臺(tái),代表著開(kāi)放軟體和開(kāi)放標(biāo)準(zhǔn),以及和產(chǎn)業(yè)界各相關(guān)領(lǐng)域的廠商合作,提供更具經(jīng)濟(jì)效益的創(chuàng)新方案,在巨量資料時(shí)代共同尋找成長(zhǎng)契機(jī),Knupffer說(shuō)。事實(shí)上,在英特爾擘劃的巨量資料藍(lán)圖中,包含了從智慧建筑、智慧城市、物聯(lián)網(wǎng)(IoT)、道路監(jiān)控、醫(yī)療保健、智慧電表、工業(yè)系動(dòng)化等所有一切必須運(yùn)用到電腦運(yùn)算和資料分析的領(lǐng)域,而最終結(jié)果,便是將所有這些領(lǐng)域串連起來(lái)。
Knupffer也指出,未來(lái)在面對(duì)巨量「非結(jié)構(gòu)化」資料時(shí),最主要的挑戰(zhàn)并不在硬體,而在軟體。因此,可「即時(shí)」分析各種不同類型非結(jié)構(gòu)化資料的軟體技術(shù),是發(fā)展巨量資料處理平臺(tái)的關(guān)鍵。但這部份,仍需要時(shí)間。這也是英特爾一直積極投資擁有相關(guān)技術(shù)公司的主因。
Knupffer并未透露太多英特爾的巨體計(jì)劃,但顯然,一個(gè)圍繞著英特爾處理器為核心,再朝四周延伸的策略已然形成。但未來(lái),這個(gè)要將眾多跨應(yīng)用領(lǐng)域的資料都串連起來(lái)的開(kāi)放平臺(tái),會(huì)有多么「開(kāi)放」──它與現(xiàn)今在許多嵌入式領(lǐng)域也占有一席之地的ARM之間的競(jìng)爭(zhēng)和消長(zhǎng)情況又是如何?繼續(xù)觀察下去,將會(huì)很有意思。
更多嵌入式資訊請(qǐng)關(guān)注嵌入式頻道