www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 物聯(lián)網(wǎng) > 智能應用
[導讀] 隨著大數(shù)據(jù)上升為國家戰(zhàn)略,大數(shù)據(jù)產(chǎn)業(yè)發(fā)展對經(jīng)濟社會的價值和影響得到廣泛認可,大數(shù)據(jù)技術(shù)逐漸滲透到各行各業(yè),成為重要的生產(chǎn)要素和戰(zhàn)略資產(chǎn)。數(shù)據(jù)量的增長,手動完成任務與自動化產(chǎn)生的生產(chǎn)力差距越來越大,這使得以人工智能和機器學習為基礎(chǔ)的自動化趨勢越來越有市場。機器學習可以幫助縮小這一差距嗎?數(shù)據(jù)管理和數(shù)據(jù)轉(zhuǎn)換之間有重要的區(qū)別。數(shù)據(jù)轉(zhuǎn)換是數(shù)據(jù)集成過程中的第一步,其目標是將異類數(shù)據(jù)轉(zhuǎn)換為通用的全局模式,組織可以提前制定該模式。自動腳本通常用于將美元轉(zhuǎn)換成歐元,或?qū)⒂㈡^轉(zhuǎn)換成公斤。盡管大數(shù)據(jù)分析技術(shù)取得了驚人的進步,但我們在很大程度上仍需要手動來完成重要任務,例如數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)管理。

 隨著大數(shù)據(jù)上升為國家戰(zhàn)略,大數(shù)據(jù)產(chǎn)業(yè)發(fā)展對經(jīng)濟社會的價值和影響得到廣泛認可,大數(shù)據(jù)技術(shù)逐漸滲透到各行各業(yè),成為重要的生產(chǎn)要素和戰(zhàn)略資產(chǎn)。數(shù)據(jù)量的增長,手動完成任務與自動化產(chǎn)生的生產(chǎn)力差距越來越大,這使得以人工智能和機器學習為基礎(chǔ)的自動化趨勢越來越有市場。機器學習可以幫助縮小這一差距嗎?數(shù)據(jù)管理和數(shù)據(jù)轉(zhuǎn)換之間有重要的區(qū)別。數(shù)據(jù)轉(zhuǎn)換是數(shù)據(jù)集成過程中的第一步,其目標是將異類數(shù)據(jù)轉(zhuǎn)換為通用的全局模式,組織可以提前制定該模式。自動腳本通常用于將美元轉(zhuǎn)換成歐元,或?qū)⒂㈡^轉(zhuǎn)換成公斤。盡管大數(shù)據(jù)分析技術(shù)取得了驚人的進步,但我們在很大程度上仍需要手動來完成重要任務,例如數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)管理。

 

坦率地說,數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)管理問題頗具挑戰(zhàn)性。各行各業(yè)的公司都渴望將機器學習與他們的數(shù)據(jù)庫結(jié)合使用,以獲得競爭優(yōu)勢。但是,數(shù)據(jù)不干凈、數(shù)據(jù)未集成、不可比較和不匹配的數(shù)據(jù)問題層出不窮,使公司的大數(shù)據(jù)計劃陷入困境。

許多從事機器學習的數(shù)據(jù)科學家花費了90%的時間來查找、集成、修復和清理其輸入數(shù)據(jù)。 人們似乎沒有意識到數(shù)據(jù)科學家不再是數(shù)據(jù)科學家,而是成為了數(shù)據(jù)集成商。不過也有一個好消息,機器學習本身可以幫助機器學習。這個想法是利用算法的預測能力來模擬人類數(shù)據(jù)處理。這不是100%完美的解決方案,但它可以幫助緩解工作強度,讓數(shù)據(jù)科學家轉(zhuǎn)向真正的創(chuàng)新工作。您可以在任何你能買到的地方購買ML,通過使用ML來來幫助您完成ETL的轉(zhuǎn)換部分。

 

轉(zhuǎn)換和管理數(shù)據(jù)

雖然它們在某些方面是相似的,但是數(shù)據(jù)管理和數(shù)據(jù)轉(zhuǎn)換之間有重要的區(qū)別。數(shù)據(jù)轉(zhuǎn)換是數(shù)據(jù)集成過程中的第一步,其目標是將異類數(shù)據(jù)轉(zhuǎn)換為通用的全局模式,組織可以提前制定該模式。自動腳本通常用于將美元轉(zhuǎn)換成歐元,或?qū)⒂㈡^轉(zhuǎn)換成公斤。

轉(zhuǎn)換階段之后,分析人員開始管理和分析數(shù)據(jù)。第一步通常涉及運行“match/merge”函數(shù)來創(chuàng)建與相同實體對應的記錄集群,例如將不同但拼寫相似的名稱分組在一起。像“編輯距離”這樣的概念可以用來確定兩個不同實體之間的距離。然后使用更多的規(guī)則來比較各種實體,以確定給定記錄的最佳值。公司可以聲明最后一項是最好的,或者使用一組值中的公共值,這樣就可以產(chǎn)生最佳數(shù)據(jù)。

幾十年來,這種通用的兩步過程已在許多數(shù)據(jù)倉庫中使用,并且在現(xiàn)代的數(shù)據(jù)湖中繼續(xù)使用。但是,ETL和數(shù)據(jù)管理在很大程度上未能跟上今天的數(shù)據(jù)量以及企業(yè)面臨的挑戰(zhàn)規(guī)模。

例如,這需要預先定義一個全局模式,這阻礙了許多ETL的進行,這些工作試圖集成更多的數(shù)據(jù)源。在有些時候,程序員無法跟上必須設(shè)置的數(shù)據(jù)轉(zhuǎn)換規(guī)則的數(shù)量。如果您有10個數(shù)據(jù)源,您還可以這樣做,但是,如果您有10,000個,那就不太可能了。顯然,這需要一種不同的方法。

在小型企業(yè)中,您可能可以提前創(chuàng)建全局數(shù)據(jù)模式,然后在整個組織中強制使用它,從而省去了昂貴的ETL和數(shù)據(jù)管理項目的成本,一起放在數(shù)據(jù)倉庫中。但是,在大型組織中,這種自上而下的方法不可避免地會失敗。

即使大型企業(yè)中的業(yè)務部門彼此非常相似,它們記錄數(shù)據(jù)的方式也會有微小的差異。這些微小差異需要加以考慮,然后才能對其進行有意義的分析,這只是企業(yè)數(shù)據(jù)性質(zhì)的反映。因此業(yè)務靈活性需要一定程度的獨立性,這意味著每個業(yè)務部門都建立自己的數(shù)據(jù)中心。

例如,以豐田汽車歐洲公司(Toyota Motor Europe)為例,該公司在每個業(yè)務國家都有獨立的客戶支持組織。該公司希望為250個數(shù)據(jù)庫中的所有實體創(chuàng)建一個主記錄,其中包含40種不同語言的3000萬條記錄。

豐田汽車歐洲公司面臨的問題是,ETL和數(shù)據(jù)管理項目的規(guī)模是巨大的,如果按照傳統(tǒng)方式進行,將消耗大量的資源。該公司決定使用Tamr來幫助解決機器學習的挑戰(zhàn),而不是數(shù)據(jù)轉(zhuǎn)換和使用數(shù)據(jù)管理過程。ETL最大的問題是已經(jīng)預先定義了全局模式,如何大規(guī)模地做到這一點是個問題。需要使用機器學習進行自下向上的匹配、自下而上地構(gòu)造目標模式,從規(guī)模上看,這是唯一可行的方式。

機器學習仍然需要大量的數(shù)據(jù)和處理能力,您通常需要一個最優(yōu)秀的員工來幫助指導軟件獲得正確的數(shù)據(jù)分析結(jié)果與決策見解。不同的供應商之間該如何選擇。不同國家或地區(qū)的供應商提供的解決方案不同,而且出于一些宏觀因素,會出現(xiàn)不同的選擇。出于安全考慮,這些數(shù)據(jù)問題不能完全外包給其他公司,所以不要指望完全用機器學習來處理數(shù)據(jù),人在其中的作用還是非常重要的。人與機器學習合作才能夠使您的數(shù)據(jù)集成和管理效率最大化。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

液壓舵機殼體是航空液壓操縱系統(tǒng)的核心零件 , 內(nèi)部包含大量復雜流道 。傳統(tǒng)的流道路徑人工設(shè)計方法效率低下 , 結(jié)果一致性差 。針對該問題 , 提出了一種基于混合近端策略優(yōu)化(HPP0算法)的流道路徑規(guī)劃算法 。通過分析流...

關(guān)鍵字: 液壓流道規(guī)劃 機器學習 HPP0算法 減材制造 液壓舵機殼體

深入探索這一個由 ML 驅(qū)動的時域超級采樣的實用方法

關(guān)鍵字: 機器學習 GPU 濾波器

傳統(tǒng)的網(wǎng)絡(luò)安全防護手段多依賴于預先設(shè)定的規(guī)則和特征庫,面對日益復雜多變、層出不窮的新型網(wǎng)絡(luò)威脅,往往力不從心,難以做到及時且精準的識別。AI 技術(shù)的融入則徹底改變了這一局面。機器學習算法能夠?qū)A康木W(wǎng)絡(luò)數(shù)據(jù)進行深度學習,...

關(guān)鍵字: 網(wǎng)絡(luò)安全 機器學習 輔助決策

人工智能(AI)和機器學習(ML)是使系統(tǒng)能夠從數(shù)據(jù)中學習、進行推理并隨著時間的推移提高性能的關(guān)鍵技術(shù)。這些技術(shù)通常用于大型數(shù)據(jù)中心和功能強大的GPU,但在微控制器(MCU)等資源受限的器件上部署這些技術(shù)的需求也在不斷增...

關(guān)鍵字: 嵌入式系統(tǒng) 人工智能 機器學習

北京——2025年7月30日 自 2018 年以來,AWS DeepRacer 已吸引全球超過 56 萬名開發(fā)者參與,充分印證了開發(fā)者可以通過競技實現(xiàn)能力成長的實踐路徑。如今,亞馬遜云科技將通過亞馬遜云科技AI聯(lián)賽,將這...

關(guān)鍵字: AI 機器學習

2025年7月28日 – 專注于引入新品的全球電子元器件和工業(yè)自動化產(chǎn)品授權(quán)代理商貿(mào)澤電子 (Mouser Electronics) 持續(xù)擴展其針對機器學習 (ML) 工作優(yōu)化的專用解決方案產(chǎn)品組合。

關(guān)鍵字: 嵌入式 機器學習 人工智能

在這個高速發(fā)展的時代,無論是健身、競技、興趣活動,還是康復訓練,對身體表現(xiàn)的感知與理解,正成為提升表現(xiàn)、實現(xiàn)突破的關(guān)鍵。如今,先進技術(shù)正為我們架起一座橋梁,將每一次身體活動轉(zhuǎn)化為有價值的洞察,幫助我們更聰明地訓練、更高效...

關(guān)鍵字: 傳感器 機器學習 IMU

在科技飛速發(fā)展的當下,邊緣 AI 正經(jīng)歷著一場深刻的變革。從最初的 TinyML 微型機器學習探索低功耗 AI 推理,到邊緣推理框架的落地應用,再到平臺級 AI 部署工具的興起以及垂類模型的大熱,我們已經(jīng)成功實現(xiàn)了 “讓...

關(guān)鍵字: 機器學習 邊緣 AI 無人機

在AI算力需求指數(shù)級增長的背景下,NVIDIA BlueField-3 DPU憑借其512個NPU核心和400Gbps線速轉(zhuǎn)發(fā)能力,為機器學習推理提供了革命性的硬件卸載方案。通過將PyTorch模型量化至INT8精度...

關(guān)鍵字: PyTorch 機器學習 DPU

中國,北京,2025年7月17日——隨著AI迅速向邊緣領(lǐng)域挺進,對智能邊緣器件的需求隨之激增。然而,要在小尺寸的微控制器上部署強大的模型,仍是困擾眾多開發(fā)者的難題。開發(fā)者需要兼顧數(shù)據(jù)預處理、模型選擇、超參數(shù)調(diào)整并針對特定...

關(guān)鍵字: 邊緣AI 嵌入式 機器學習
關(guān)閉