什么是大數(shù)據(jù)分析?大數(shù)據(jù)又可以帶來什么?
本文中,小編將對大數(shù)據(jù)予以介紹,如果你想對大數(shù)據(jù)的詳細情況有所認識,或者想要增進對大數(shù)據(jù)的了解程度,不妨請看以下內(nèi)容哦。
一、什么是大數(shù)據(jù)分析
正如前面說的,大數(shù)據(jù)分析其實就體現(xiàn)在“大”這個特點上,即對規(guī)模巨大的數(shù)據(jù)進行分析。比較經(jīng)典也比較廣為接受的對大數(shù)據(jù)概念的定義為IBM提出的“5V”特征:1.數(shù)據(jù)量大(Volume,數(shù)據(jù)存量大,待處理分析的數(shù)據(jù)規(guī)模大);2.速度快(Velocity,不僅是存量大,數(shù)據(jù)的增長速度也快,這就對及時的大數(shù)據(jù)處理也提出了要求);3.類型多(Variety,數(shù)據(jù)類型可以歸為結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化,但具體的形式卻千差萬別,盡管最后都會轉(zhuǎn)化為數(shù)據(jù)流,但不同形式的數(shù)據(jù)處理的方法和難度并不相同);4.價值(Value,大數(shù)據(jù)的處理成本大,于是我們需要常常思考,我們分析大數(shù)據(jù)的價值是什么,而我個人的觀點是:數(shù)據(jù)是客觀現(xiàn)實的一個反饋,我們分析數(shù)據(jù)其實是在分析過去,它一定是有價值,只不過這個價值的挖掘難易程度不盡相同);5.真實性(Veracity,數(shù)據(jù)量大一定會伴隨這數(shù)據(jù)的失真,部分數(shù)據(jù)不確定的情況,所以在分析過程中還要考慮數(shù)據(jù)的真實性問題,這決定了從中挖掘出的數(shù)據(jù)價值的難易)。
這只是眾多定義中的一種,其他的定義也是一樣的,總的來說就是,“大數(shù)據(jù)”首先的特點是量大,這就導致了處理難度的升高,那這件事這么費勁會什么要做呢?就得了解到大數(shù)據(jù)的潛在價值。當然,我個人覺得,現(xiàn)在的大數(shù)據(jù)處理的價值在于可以通過中央平臺去同時處理海量的數(shù)據(jù),節(jié)省空間和成本,大家應該會有感觸,就是很多公司會建立自己的數(shù)據(jù)中臺,輸出各種數(shù)據(jù)、圖表和報告,相當于一個大的數(shù)據(jù)池,但是具體的分析為什么還是要落實到各個業(yè)務線呢,就是因為實際中的東西千差萬別,很難用一套既定的方法或模式走太遠,所以需要結(jié)合各個業(yè)務部門對實際的客戶需求的理解、對實際數(shù)據(jù)的理解進行再加工。推薦大家可以去看本書:《痛點》,它是大數(shù)據(jù)分析下的一股清流,專注于小數(shù)據(jù)分析,從小數(shù)據(jù)中挖掘出價值。
二、大數(shù)據(jù)可帶來什么
人們對大數(shù)據(jù)的癡迷是可以理解的。畢竟,在現(xiàn)實生活中,有很多分歧和不同的意見。最有說服力的往往是數(shù)據(jù)。冰冰的數(shù)據(jù)往往是非主觀的,它確實比主觀的觀點更值得信賴,這意味著社會進步已經(jīng)取得了進步!但一旦大數(shù)據(jù)(Big data)被夸大或不當使用,人們的錯誤觀點往往會加深并進一步固化!
大數(shù)據(jù)起著很大的作用,可以給我們帶來很多好處,但是它并不是萬能的,也有很多的局限性,一旦迷信的大數(shù)據(jù)沒有做認真的分析和判斷,往往把這個偶然的現(xiàn)象當作規(guī)律來處理,這時你就會投入大量的資源去分配,教訓就會接踵而至!
大數(shù)據(jù)主要做三件事:了解用戶,了解信息,了解關(guān)系。如果這三件事之間還有一件事要提及的話,那就是所謂的趨勢;還有政府所做的輿論監(jiān)督,它可以監(jiān)測大規(guī)模的數(shù)據(jù)和分析人們的活動行為。大數(shù)據(jù)最大的特點是數(shù)據(jù)量大、種類多,記錄了大量的細節(jié)、過程,存儲了各種記錄和信息
但是大數(shù)據(jù),利用效率較低、質(zhì)量差、內(nèi)容繁雜、占用存儲空間大。大數(shù)據(jù)記錄太多數(shù)據(jù),不一定都是需要的,有時重要的信息只占很低比例,這就是質(zhì)量低、利用效率低。大數(shù)據(jù)是人工智能、智慧城市等的基礎(chǔ),因為有大量數(shù)據(jù),得以使人工智能快速訓練、從中提取經(jīng)驗;獲取重要信息、聯(lián)合組網(wǎng),形成規(guī)模宏大的智慧集群。
大數(shù)據(jù)是中性的,有利有弊。要記錄數(shù)據(jù)、從大量數(shù)據(jù)中、獲取有用的數(shù)據(jù)、篩濾信息、對有用數(shù)據(jù)進行提取、排序等,需要消耗大量的資源去處理。大數(shù)據(jù)不僅僅指的數(shù)據(jù)體量大,數(shù)據(jù)記錄多。更重要的是數(shù)據(jù)的維度要豐富。如精準獲客,就需要知道人的年齡,性別,位置變化,消費行為,支付數(shù)據(jù)等數(shù)據(jù),維度越豐富,畫像越精準,一個維度就好比一個像素,像素越高,照片越清晰。
以上便是小編此次帶來的有關(guān)大數(shù)據(jù)的全部內(nèi)容,十分感謝大家的耐心閱讀,想要了解更多相關(guān)內(nèi)容,或者更多精彩內(nèi)容,請一定關(guān)注我們網(wǎng)站哦。