www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 嵌入式 > 嵌入式動態(tài)
[導讀]近年來,有關大數據的熱點話題一浪高過一浪,關注大數據應用的人也越來越多。總體來說,人們對大數據的前景持樂觀態(tài)度,比如談到大數據的技術特征,人們最容易想起的就是4個

近年來,有關大數據的熱點話題一浪高過一浪,關注大數據應用的人也越來越多??傮w來說,人們對大數據的前景持樂觀態(tài)度,比如談到大數據的技術特征,人們最容易想起的就是4個“v”:vast(數量龐大)、variety(種類繁多)、velocity(增長迅速)和value(總價值高)。這些都沒錯,但仔細一想,它們都是偏重說明大數據的正面優(yōu)勢的。但其實,大也有大的難處,大數據也不可避免地存在著一些負面劣勢。結合筆者的從業(yè)經驗,大數據的負面劣勢可以概括為4個“n”,下面逐一說明每個n的含義。

inflated大數據是肥胖的。大數據的大不僅僅體現在數據記錄的行數多,更體現在字段變量的列數多,這就為分析多因素之間的關聯性帶來了難度。哪怕是最簡單的方差分析,計算一兩個還行,計算一兩百個就讓人望而生畏了。

unstructured大數據是非結構化的。大數據的結構也是非常復雜的,既包括像交易額、時間等連續(xù)型變量,像性別、工作類型等離散型變量這樣傳統(tǒng)的結構化數據,更增添了如文本、社會關系網絡,乃至語音、圖像等大量新興的非結構化數據,而這些非結構化數據蘊含的信息量往往更加巨大,但分析手段卻略顯單薄。

incomplete大數據是殘缺的。在現實的世界里,由于用戶登記的信息不全、計算機數據存儲的錯誤等種種原因,數據缺失是常見的現象。在大數據的場景下,數據缺失更是家常便飯,這就為后期的分析與建模質量增加了不確定的風險。

abnormal大數據是異常的。同樣,在現實的世界里,大數據里還有不少異常值(outlier)。比如某些連續(xù)型變量(如一個短期時間內的交易金額)的取之太大,某些離散型變量(如某個被選購的產品名稱)里的某個水平值出現的次數太少,等等。如果不刪除,很可能干擾模型系數的計算和評估;如果直接刪除,又覺得缺乏說服力,容易引起他人的質疑。這使得分析人員落到了一個進退兩難的境地。

如果不能處理好這些不利因素,大數據應用的優(yōu)勢很難發(fā)揮出來。想要擁抱大數據,并不是一項在常規(guī)條件下數據分析的簡單升級,而是一項需要大智慧的綜合工作。STIR(喚醒)策略是筆者在實踐工作中提煉出來的、能夠在實際工作中有效克服大數據負面劣勢的應對方法。具體來說,STIR策略包含了四種技術手段,目前都已經有機地整合在統(tǒng)計分析與數據挖掘專業(yè)軟件JMP中了,它可以用來解決上文提出的四個問題,下面將分別說明。

Switching Variables切換變量

它是用來解決大數據“殘缺”問題的。通過“列轉換器”、“動畫播放”等工具,海量因素之間的關聯性分析變得十分簡單、快捷,還可以根據需要對關聯性的重要程度進行排序,大數據分析的效率由此得到大幅提升。

Text Mining文本挖掘

它是用來解決大數據“非結構化”問題的。通過先對文字、圖像等新媒體信息源進行降維、去噪、轉換等處理,產生結構化數據,再用成熟的統(tǒng)計分析和數據挖掘方法進行評價和解釋。這樣一來,大數據的應用范圍得到了極大的拓展。

基于JMP軟件的文本分析結果的最終展現界面

Imputation缺失數賦值

它是用來解決大數據“殘缺”問題的。在有missing data的時候,我們并不完全排斥直接刪除的方法,但更多的時候,我們會在條件允許的情況下,用賦值的方法去替代原先的缺失值。具體的技術很多,簡單的如計算平均值、中位數、眾數之類的統(tǒng)計量,復雜的如用回歸、決策樹、貝葉斯定理去預測缺失數的近似值等。這樣一來,大數據的質量大為改觀,為后期的分析與建模奠定了扎實的基礎。

基于JMP軟件的缺失數賦值方法選擇的操作界面

Robust Modeling穩(wěn)健建模

它是用來解決大數據“異常”問題的。在融入了自動識別、重要性加權等處理手段后,分析人員既直接消除了個別強影響點的敏感程度,又綜合考慮了所有數據的影響,增強了模型的抗干擾能力,使得模型體現出良好的預測特性,由此做出的業(yè)務決策自然變得更加科學、精準。

基于JMP軟件模型穩(wěn)健擬合的報表界面

總之,我們必須要對大數據有一個全面、客觀的認識。只有在不同的業(yè)務和數據背景下采用不同的戰(zhàn)略戰(zhàn)術,才能在大數據時代,真正發(fā)揮大數據的杠桿作用,有效提高企業(yè)的運營效率和市場競爭力。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據LED驅動電源的公式,電感內電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉