什么是大數(shù)據(jù)分析?大數(shù)據(jù)分析的含義與目前形式
“很多人還沒搞清楚什么是PC互聯(lián)網(wǎng),移動互聯(lián)網(wǎng)來了,我們還沒搞清楚移動互聯(lián)的時候,大數(shù)據(jù)時代又來了?!薄R云卸任演講
大數(shù)據(jù)已經(jīng)應(yīng)用到各行各業(yè),發(fā)揮著不可替代的作用,創(chuàng)造著不可估量的價值。然而隨著時代潮流的大邁步,市場上對數(shù)據(jù)分析人才的缺口已經(jīng)很大,據(jù)調(diào)查,目前近60%企業(yè)已成立數(shù)據(jù)分析相關(guān)部門,超過1/3的企業(yè)已經(jīng)將大數(shù)據(jù)分析應(yīng)用于其日常運營和銷售中。那么究竟什么是大數(shù)據(jù)分析呢?
大數(shù)據(jù)分析是指對規(guī)模巨大的數(shù)據(jù)進行分析。大數(shù)據(jù)可以概括為4個V, 數(shù)據(jù)量大(Volume)、速度快(Velocity)、類型多(Variety)、價值(Value)。
大數(shù)據(jù)作為時下最火熱的IT行業(yè)的詞匯,隨之而來的數(shù)據(jù)倉庫、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點。隨著大數(shù)據(jù)時代的來臨,大數(shù)據(jù)分析也應(yīng)運而生。
大數(shù)據(jù)分析可以分為大數(shù)據(jù)和分析兩個方面。如今大數(shù)據(jù)已經(jīng)經(jīng)常出現(xiàn)在報紙新聞當(dāng)中,但大數(shù)據(jù)與大數(shù)據(jù)分析并不是同一概念。假如沒有數(shù)據(jù)分析,再多的數(shù)據(jù)都只能是一堆儲存維護成本高而毫無用處的IT庫存。國外發(fā)達國家的大數(shù)據(jù)分析更注重分析,從分析出發(fā)去找數(shù)據(jù),然后再有效地將從數(shù)據(jù)中得到的信息有效利用;而國內(nèi),對大數(shù)據(jù)的理解有失偏頗,盲目注重于大數(shù)據(jù)的采集而未能對收集到的數(shù)據(jù)有效利用,或許只是簡單的畫個圖表得出表層結(jié)論而已,難以對數(shù)據(jù)的深層價值進行深入挖掘。
關(guān)于大數(shù)據(jù)分析具體含義
1、數(shù)據(jù)分析可以讓人們對數(shù)據(jù)產(chǎn)生更加優(yōu)質(zhì)的詮釋,而具有預(yù)知意義的分析可以讓分析員根據(jù)可視化分析和數(shù)據(jù)分析后的結(jié)果做出一些預(yù)測性的推斷。
2、大數(shù)據(jù)的分析與存儲和數(shù)據(jù)的管理是一些數(shù)據(jù)分析層面的最佳實踐。通過按部就班的流程和工具對數(shù)據(jù)進行分析可以保證一個預(yù)先定義好的高質(zhì)量的分析結(jié)果。
3、不管使用者是數(shù)據(jù)分析領(lǐng)域中的專家,還是普通的用戶,可作為數(shù)據(jù)分析工具的始終只能是數(shù)據(jù)可視化。可視化可以直觀的展示數(shù)據(jù),讓數(shù)據(jù)自己表達,讓客戶得到理想的結(jié)果。
4、大數(shù)據(jù)已經(jīng)不像前些年給人一種虛無縹緲的感覺,而當(dāng)下最重要的是對大數(shù)據(jù)進行分析,只有經(jīng)過分析的數(shù)據(jù),才能對用戶產(chǎn)生最重要的價值,越來越多人開始對什么是大數(shù)據(jù)分析產(chǎn)生聯(lián)想,所以大數(shù)據(jù)的分析方式在整個IT領(lǐng)域就顯得尤為重要,可以說是決定最終信息是否有價值的決定性因素。
大數(shù)據(jù)分析目前存在以下三個問題
數(shù)據(jù)存儲問題:隨著技術(shù)不斷發(fā)展,數(shù)據(jù)量從TB上升至PB,EB量級,如果還用傳統(tǒng)的數(shù)據(jù)存儲方式,必將給大數(shù)據(jù)分析造成諸多不便,這就需要借助數(shù)據(jù)的動態(tài)處理技術(shù),即隨著數(shù)據(jù)的規(guī)律性變更和顯示需求,對數(shù)據(jù)進行非定期的處理。同時,數(shù)量極大的數(shù)據(jù)不能直接使用傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫進行存儲,人們需要探索一種適合大數(shù)據(jù)的數(shù)據(jù)儲存模式,也是當(dāng)下應(yīng)該著力解決的一大難題。
分析資源調(diào)度問題:大數(shù)據(jù)產(chǎn)生的時間點,數(shù)據(jù)量都是很難計算的,這就是大數(shù)據(jù)的一大特點,不確定性。所以我們需要確立一種動態(tài)響應(yīng)機制,對有限的計算、存儲資源進行合理的配置及調(diào)度。另外,如何以最小的成本獲得最理想的分析結(jié)果也是一個需要考慮的問題。
專業(yè)的分析工具:在發(fā)展數(shù)據(jù)分析技術(shù)的同時,傳統(tǒng)的軟件工具不再適用。目前人類科技尚不成熟,距離開發(fā)出能夠滿足大數(shù)據(jù)分析需求的通用軟件還有一定距離。 如若不能對這些問題做出處理,在不久的將來大數(shù)據(jù)的發(fā)展就會進入瓶頸,甚至有可能出現(xiàn)一段時間的滯留期,難以持續(xù)起到促進經(jīng)濟發(fā)展的作用。