Pentaho:物聯(lián)網(wǎng)與大數(shù)據(jù)的應(yīng)用整合
掃描二維碼
隨時(shí)隨地手機(jī)看文章
物聯(lián)網(wǎng)和大數(shù)據(jù)都是時(shí)下最熱門的話題與技術(shù)。如何將兩者結(jié)合起來,構(gòu)建一個(gè)完整的解決方案,是一個(gè)把握未來命脈的領(lǐng)域。隨著全球科技信息化的飛速發(fā)展,各個(gè)國家趕著時(shí)代的潮流邁入了大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析成為了企業(yè)的核心競爭力。
然而,信息化建設(shè)是條漫長且持續(xù)的發(fā)展道路,由于建設(shè)時(shí)期不同,錄入人員不同,信息化系統(tǒng)不同,格式規(guī)范要求不同等,造成了數(shù)據(jù)的不一致性,不同的應(yīng)用系統(tǒng)形成了彼此孤立的信息孤島,沒有一座統(tǒng)一的橋梁,管理者想要得到幾項(xiàng)信息必須進(jìn)到不同的系統(tǒng)中進(jìn)行查詢,且查詢所得無法進(jìn)行統(tǒng)一分析比較,綜合利用,即使擁有豐富的數(shù)據(jù)資源,也沒法提煉出有價(jià)值的信息輔助決策。
企業(yè)面臨著日益嚴(yán)峻的挑戰(zhàn),如何更好地管理種類和數(shù)量不斷增長的數(shù)據(jù),并從中提取重要價(jià)值已為燃眉之急。幸運(yùn)的是,Pentaho現(xiàn)已正式加入HDS的大家庭,未來將與我們一起就項(xiàng)目與解決方案進(jìn)行合作,共創(chuàng)美好數(shù)據(jù)未來。
集成>探查>可視化>預(yù)測(cè)
Pentaho 將數(shù)據(jù)集成與商業(yè)分析緊密結(jié)合,使 IT 和業(yè)務(wù)用戶能夠訪問、集成、混合、可視化并分析對(duì)業(yè)務(wù)成效具有重要影響的所有數(shù)據(jù)。從本質(zhì)上來說,Pentaho是一款開放式平臺(tái),它可以快速進(jìn)行部署,易于使用,并且極為經(jīng)濟(jì)高效。簡而言之,它就是一款專門用于滿足未來分析需求的平臺(tái)。
》》數(shù)據(jù)集成
利用 Pentaho Data Integration(PDI,數(shù)據(jù)集成功能),企業(yè)可以訪問來自復(fù)雜異構(gòu)來源的數(shù)據(jù),并將其與現(xiàn)有的各類數(shù)據(jù)混合,生成適用于分析的高質(zhì)量信息。PDI通過豐富的圖形用戶界面和并行處理引擎提供高性能的ETL(提取、轉(zhuǎn)換和加載)功能,可滿足所有數(shù)據(jù)集成要求,包括大數(shù)據(jù)。
》》數(shù)據(jù)發(fā)現(xiàn)和探查
Pentaho Business Analytics 可以提供現(xiàn)代化的高度交互式直觀 Web 界面,使業(yè)務(wù)用戶能夠訪問和發(fā)現(xiàn)所有數(shù)據(jù),包括大數(shù)據(jù)。借助一系列日益先進(jìn)的分析功能,用戶可以創(chuàng)建報(bào)告和儀表板,從多個(gè)維度實(shí)現(xiàn)數(shù)據(jù)可視化并對(duì)其進(jìn)行分析,而無需依賴IT和開發(fā)人員。
》》數(shù)據(jù)可視化
Pentaho Data Integration能夠提供豐富的圖形化可視設(shè)計(jì)環(huán)境,以縮短時(shí)間并降低復(fù)雜性。
Pentaho Business Analytics可以為業(yè)務(wù)用戶提供基于 Web 的直觀交互式報(bào)告,為高級(jí)用戶提供豐富的圖形化企業(yè)報(bào)告設(shè)計(jì)器。提供交互式數(shù)據(jù)可視化和分析,并通過可視化套索過濾和縮放功能,以了解或排除異常值。根據(jù)屬性突出顯示功能,以提供具有更高視覺對(duì)比度的數(shù)據(jù)顯示。另外還擁有豐富的交互式可視化工具庫,包括地理圖、熱度網(wǎng)格和散點(diǎn)氣泡圖。
》》數(shù)據(jù)預(yù)測(cè)分析
Pentaho 還提供強(qiáng)大、先進(jìn)的機(jī)器學(xué)習(xí)算法和數(shù)據(jù)處理工具。數(shù)據(jù)科學(xué)家和分析人員可以發(fā)現(xiàn)標(biāo)準(zhǔn)分析和報(bào)告無法顯示的重要模式以及相互關(guān)系。時(shí)序預(yù)測(cè)等復(fù)雜的先進(jìn)分析可以幫助企業(yè)在更充分地了解過往業(yè)務(wù)績效的基礎(chǔ)上,針對(duì)希望實(shí)現(xiàn)的未來成果制定相關(guān)計(jì)劃。
那么,在物聯(lián)網(wǎng)領(lǐng)域,如何利用Pentaho更好的與數(shù)據(jù)打交道?
首先當(dāng)然是需要獲得IoT數(shù)據(jù),才能對(duì)其進(jìn)行搗鼓、分析。IoT數(shù)據(jù)不象看起來那么普遍,至少值得分析的數(shù)據(jù)量很少,而在關(guān)鍵型物聯(lián)網(wǎng) (IoTTM) 領(lǐng)域獲取數(shù)據(jù)更是難上加難。利用 Pentaho Data Integration,企業(yè)可以訪問來自復(fù)雜異構(gòu)來源的數(shù)據(jù),并將其與現(xiàn)有的各類數(shù)據(jù)混合,生成適用于分析的高質(zhì)量信息。
我們舉個(gè)例子說明:比如智能邊緣“人員檢測(cè)器”,此設(shè)備用于拍攝像片,并分析人臉與上半身圖像。設(shè)備由PDI控制,自動(dòng)運(yùn)行,收集圖像并分析,然后在傳感器日志中記錄結(jié)果。如果檢測(cè)到人臉或身體,就會(huì)決定是否碰到“人”了,隨后會(huì)在HDS HCP中存儲(chǔ)相應(yīng)圖像。所有一切都會(huì)記錄在傳感器日志中,不過,如果檢測(cè)到人,會(huì)攝取圖像,連同圖像輪廓圖,以描述性文件名存儲(chǔ)于對(duì)象存儲(chǔ)。
物聯(lián)網(wǎng)時(shí)代:Pentaho不懼現(xiàn)在,更關(guān)乎未來
圖像保存時(shí),其文件名的描述很清楚,包括時(shí)間戳、傳感器標(biāo)識(shí)號(hào)、人臉數(shù)量、身體數(shù)量、人數(shù)。一旦碰到了“人”,完成存儲(chǔ)后,您就有了大量的IoT數(shù)據(jù)可以分析了。你可以點(diǎn)擊任何文件名,預(yù)覽被檢測(cè)物體的輪廓圖像。
此圖中檢測(cè)到21個(gè)身體但缺少臉部。從數(shù)據(jù)點(diǎn)拉取的圖像得知,原來這21個(gè)是來自一則廣告(只有臉部,沒有身體)。這個(gè)案例充分體現(xiàn)了Pentaho analytics 如何與IoT設(shè)備充分融合做數(shù)據(jù)收集和分析。
Pentaho 提供了涵蓋整個(gè)大數(shù)據(jù)生命周期的完整解決方案,可利用從數(shù)據(jù)發(fā)現(xiàn)到預(yù)測(cè)分析的一系列分析功能,對(duì)任何基礎(chǔ)架構(gòu)中的大數(shù)據(jù)和傳統(tǒng)類型數(shù)據(jù)進(jìn)行數(shù)據(jù)提取和準(zhǔn)備。利用 Pentaho,我們現(xiàn)在可以立即了解需要處理的是一個(gè)一次性錯(cuò)誤還是一種錯(cuò)誤模式。Pentaho 非常直觀易用,我們可以輕松靈活地對(duì)其進(jìn)行調(diào)整,以滿足不斷變化的要求,最終贏得的是整個(gè)未來!