www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 物聯(lián)網(wǎng) > 智能應用
[導讀]傳統(tǒng)機器學習 (ML) 模型和 AI 技術通常存在一個嚴重缺陷:它們缺乏不確定性量化。這些模型通常提供點估計,而不考慮其預測的不確定性。這種限制削弱了評估模型輸出可靠性的能力。此外,傳統(tǒng) ML 模型需要大量數(shù)據(jù),通常需要正確標記的數(shù)據(jù),因此,在數(shù)據(jù)有限的問題上往往會遇到困難。此外,這些模型缺乏將專家領域知識或先驗信念納入模型的系統(tǒng)框架。如果無法利用特定領域的見解,模型可能會忽略數(shù)據(jù)中的關鍵細微差別,并且往往無法發(fā)揮其潛力。ML 模型正變得越來越復雜和不透明,人們越來越需要數(shù)據(jù)和人工智能做出的決策具有更高的透明度和可問責性。

傳統(tǒng)機器學習 (ML) 模型和 AI 技術通常存在一個嚴重缺陷:它們缺乏不確定性量化。這些模型通常提供點估計,而不考慮其預測的不確定性。這種限制削弱了評估模型輸出可靠性的能力。此外,傳統(tǒng) ML 模型需要大量數(shù)據(jù),通常需要正確標記的數(shù)據(jù),因此,在數(shù)據(jù)有限的問題上往往會遇到困難。此外,這些模型缺乏將專家領域知識或先驗信念納入模型的系統(tǒng)框架。如果無法利用特定領域的見解,模型可能會忽略數(shù)據(jù)中的關鍵細微差別,并且往往無法發(fā)揮其潛力。ML 模型正變得越來越復雜和不透明,人們越來越需要數(shù)據(jù)和人工智能做出的決策具有更高的透明度和可問責性。

概率編程:解決這些挑戰(zhàn)的解決方案

概率編程提供了一個解決這些挑戰(zhàn)的建模框架。其核心是貝葉斯統(tǒng)計,與頻率派的統(tǒng)計學解釋不同。

貝葉斯統(tǒng)計

在頻率統(tǒng)計學中,概率被解釋為事件的長期相對頻率。數(shù)據(jù)被認為是隨機的,是從固定定義的分布中抽樣的結果。因此,測量中的噪聲與抽樣變化有關。頻率論者認為概率是存在的,并且是固定的,無限的實驗都會收斂到這個固定值。頻率論方法不為參數(shù)分配概率分布,他們對不確定性的解釋植根于估計量的長期頻率特性,而不是關于參數(shù)值的明確概率陳述。

在貝葉斯統(tǒng)計中,概率被解釋為對特定信念的不確定性的度量。數(shù)據(jù)被視為固定的,而系統(tǒng)的未知參數(shù)被視為隨機變量,并使用概率分布進行建模。貝葉斯方法可以捕獲參數(shù)本身的不確定性,因此提供了一種更直觀、更靈活的不確定性量化方法。

頻率統(tǒng)計與貝葉斯統(tǒng)計[1]

概率機器學習

在頻率論 ML 中,模型參數(shù)被視為固定的,并通過最大似然估計 (MLE) 進行估計,其中似然函數(shù)量化了給定統(tǒng)計模型觀察數(shù)據(jù)的概率。MLE 尋求最大化此概率的參數(shù)點估計。要實現(xiàn) MLE:

· 假設一個模型和底層模型參數(shù)。

· 根據(jù)假設模型推導似然函數(shù)。

· 優(yōu)化似然函數(shù)以獲得參數(shù)的點估計。

因此,包括深度學習在內的頻率學派模型依賴優(yōu)化(通?;谔荻?作為其基本工具。

相反,貝葉斯方法對未知參數(shù)及其與概率分布的關系進行建模,并在我們獲得新數(shù)據(jù)時使用貝葉斯定理來計算和更新這些概率。

貝葉斯定理: “貝葉斯規(guī)則告訴我們如何從關節(jié)點導出條件概率,條件告訴我們如何理性地更新我們的信念,而更新信念正是學習和推理的全部內容”[2]。

這是一個簡單但有力的等式。

· 先驗表示對未知參數(shù)的初始信念

· 似然表示基于假設模型的數(shù)據(jù)的概率

· 邊際似然是模型證據(jù),是一個標準化系數(shù)。

· 后驗分布代表我們對參數(shù)的更新信念,結合了先驗知識和觀察到的證據(jù)。

在貝葉斯機器學習中,推理是基本工具。利用后驗分布表示的參數(shù)分布進行推理,可以更全面地理解不確定性。

貝葉斯更新的實際應用: 下圖展示了一個簡單的拋硬幣實驗,在不同樣本量和兩個不同的先驗分布下,其后驗分布。此可視化提供了不同樣本量和先驗信念的組合如何影響最終的后驗分布的見解。

樣本大小和先驗對后驗分布的影響

如何建立后驗分布模型

在大多數(shù)情況下,看似簡單的后驗分布很難計算。特別是,分母,即邊際似然積分往往是可交互的,尤其是在處理更高維度的參數(shù)空間時。而且在大多數(shù)情況下,沒有閉式解,數(shù)值積分方法也是計算密集型的。為了應對這一挑戰(zhàn),我們依靠一類稱為馬爾可夫鏈蒙特卡羅模擬的特殊算法來建模后驗分布。這里的想法是從后驗分布中抽樣,而不是明確地對其進行建模并使用這些樣本來表示模型參數(shù)的分布

馬爾可夫鏈蒙特卡洛(MCMC)

“ MCMC 方法包括一類從概率分布中抽樣的算法。通過構建以期望分布作為其平衡分布的馬爾可夫鏈,可以通過記錄鏈中的狀態(tài)來獲得期望分布的樣本” [3]。一些常用的 MCMC 采樣器包括:

· 大都會-黑斯廷斯

· 吉布斯取樣器

· 哈密頓蒙特卡羅 (HMC)

· 無掉頭采樣器 (NUTS)

· 序貫蒙特卡洛 (SMC)

概率規(guī)劃

概率編程是貝葉斯統(tǒng)計的編程框架,即它涉及表示條件推理問題的語言的語法和語義的開發(fā),以及為這些推理問題開發(fā)“求解器”。本質上,概率編程之于貝葉斯建模就像自動微分工具之于經典機器學習和深度學習模型一樣[2]。

概率編程語言生態(tài)系統(tǒng)多種多樣,每種語言都有自己的語法、語義和功能。一些最流行的語言包括:

· BUGS(使用吉布斯抽樣的貝葉斯推理)[4]: BUGS 是最早的概率編程語言之一,以其用戶友好的界面和對各種概率模型的支持而聞名。它實現(xiàn)了吉布斯抽樣和其他馬爾可夫鏈蒙特卡羅 (MCMC) 方法進行推理。

· JAGS(Just Another Gibbs Sampler)[5]: JAGS 是一種用于貝葉斯分層建模的專用語言,特別適合具有嵌套結構的復雜模型。它利用 Gibbs 采樣算法進行后驗推理。

· STAN:一種概率編程語言,以其富有表現(xiàn)力的建模語法和高效的采樣算法而聞名。STAN 在學術界和工業(yè)界廣泛用于各種貝葉斯建模任務。“Stan 與 BUGS 和 JAGS 的主要區(qū)別在于兩個方面。首先,Stan 基于一種新的命令式概率編程語言,這種語言比 BUGS 或 JAGS 所基于的聲明式圖形建模語言更靈活、更具表現(xiàn)力,例如聲明具有類型的變量以及支持局部變量和條件語句。其次,Stan 的馬爾可夫鏈蒙特卡羅 (MCMC) 技術基于漢密爾頓蒙特卡羅 (HMC),對于具有復雜后驗的模型,這是一種比吉布斯采樣或 Metropolis-Hastings 更高效、更強大的采樣器” [6]。

· BayesDB: BayesDB 是一個概率編程平臺,專為大規(guī)模數(shù)據(jù)分析和概率數(shù)據(jù)庫查詢而設計。它使用戶能夠使用類似 SQL 的查詢對關系數(shù)據(jù)庫執(zhí)行概率推理 [7]

· PyMC3: PyMC3 是一個用于概率編程的 Python 庫,它提供了一個直觀而靈活的界面來構建和分析概率模型。它利用先進的采樣算法(如漢密爾頓蒙特卡羅 (HMC) 和自動微分變分推理 (ADVI))進行推理 [8]。

· TensorFlow Probability: “ TensorFlow Probability (TFP) 是一個基于 TensorFlow 構建的 Python 庫,它可以輕松地在現(xiàn)代硬件(TPU、GPU)上結合概率模型與深度學習” [9] 。

· Pyro: “Pyro 是一種用 Python 編寫的通用概率編程語言 (PPL),后端由 PyTorch 支持。Pyro 支持靈活且富有表現(xiàn)力的深度概率建模,將現(xiàn)代深度學習和貝葉斯建模的優(yōu)點統(tǒng)一起來” [10]。

這些語言共享一個通用的工作流程,概述如下:

1. 模型定義:模型定義控制數(shù)據(jù)生成、潛在參數(shù)及其相互關系的過程。此步驟需要仔細考慮底層系統(tǒng)及其行為的假設。

2. 先驗分布規(guī)范:定義模型中未知參數(shù)的先驗分布。這些先驗編碼了從業(yè)者在觀察任何數(shù)據(jù)之前對參數(shù)的信念、領域或先驗知識。

3. 似然函數(shù): 描述似然函數(shù),表示在未知參數(shù)條件下觀測數(shù)據(jù)的概率分布。似然函數(shù)量化了模型預測與觀測數(shù)據(jù)之間的一致性。

4. 后驗分布推斷:使用采樣算法根據(jù)觀測數(shù)據(jù)近似模型參數(shù)的后驗分布。這通常涉及運行馬爾可夫鏈蒙特卡羅 (MCMC) 或變分推斷 (VI) 算法以從后驗分布中生成樣本。

案例研究:預測股票指數(shù)波動率

在本案例研究中,我們將采用貝葉斯建模技術來預測股票指數(shù)的波動性。這里的波動性衡量股票價格隨時間的變化程度,是評估特定股票相關風險的關鍵指標。

數(shù)據(jù):為了進行此分析,我們將利用標準普爾 500 股票指數(shù)的歷史數(shù)據(jù)。標準普爾 500 指數(shù)是一種廣泛使用的基準指數(shù),用于追蹤美國 500 只大盤股的表現(xiàn)。通過檢查該指數(shù)價格隨時間變化的百分比,我們可以深入了解其波動性。

標準普爾 500 指數(shù) — 股價和百分比變化

從上圖中我們可以看到時間序列——連續(xù)幾天之間的價格變化:

· 恒定均值

· 方差隨時間變化,即時間序列表現(xiàn)出異方差

異方差建模: “在統(tǒng)計學中,如果一系列隨機變量都具有相同的有限方差,則該序列是同方差的;這也稱為方差齊性?;パa的概念稱為異方差,也稱為方差異質性”[11]。 自回歸條件異方差(ARCH) 模型專門用于解決時間序列數(shù)據(jù)中的異方差問題。

ARCH 模型的貝葉斯實現(xiàn)與頻率派實現(xiàn)

貝葉斯建模的主要優(yōu)勢包括能夠整合先驗信息并量化模型參數(shù)和預測中的不確定性。這在數(shù)據(jù)有限且有先驗知識的情況下尤其有用。

總之,貝葉斯建模和概率編程提供了強大的工具來解決傳統(tǒng)機器學習方法的局限性。通過采用不確定性量化、結合先驗知識并提供透明的推理機制,這些技術使數(shù)據(jù)科學家能夠在復雜的現(xiàn)實場景中做出更明智的決策。


本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

液壓舵機殼體是航空液壓操縱系統(tǒng)的核心零件 , 內部包含大量復雜流道 。傳統(tǒng)的流道路徑人工設計方法效率低下 , 結果一致性差 。針對該問題 , 提出了一種基于混合近端策略優(yōu)化(HPP0算法)的流道路徑規(guī)劃算法 。通過分析流...

關鍵字: 液壓流道規(guī)劃 機器學習 HPP0算法 減材制造 液壓舵機殼體

深入探索這一個由 ML 驅動的時域超級采樣的實用方法

關鍵字: 機器學習 GPU 濾波器

傳統(tǒng)的網(wǎng)絡安全防護手段多依賴于預先設定的規(guī)則和特征庫,面對日益復雜多變、層出不窮的新型網(wǎng)絡威脅,往往力不從心,難以做到及時且精準的識別。AI 技術的融入則徹底改變了這一局面。機器學習算法能夠對海量的網(wǎng)絡數(shù)據(jù)進行深度學習,...

關鍵字: 網(wǎng)絡安全 機器學習 輔助決策

人工智能(AI)和機器學習(ML)是使系統(tǒng)能夠從數(shù)據(jù)中學習、進行推理并隨著時間的推移提高性能的關鍵技術。這些技術通常用于大型數(shù)據(jù)中心和功能強大的GPU,但在微控制器(MCU)等資源受限的器件上部署這些技術的需求也在不斷增...

關鍵字: 嵌入式系統(tǒng) 人工智能 機器學習

北京——2025年7月30日 自 2018 年以來,AWS DeepRacer 已吸引全球超過 56 萬名開發(fā)者參與,充分印證了開發(fā)者可以通過競技實現(xiàn)能力成長的實踐路徑。如今,亞馬遜云科技將通過亞馬遜云科技AI聯(lián)賽,將這...

關鍵字: AI 機器學習

2025年7月28日 – 專注于引入新品的全球電子元器件和工業(yè)自動化產品授權代理商貿澤電子 (Mouser Electronics) 持續(xù)擴展其針對機器學習 (ML) 工作優(yōu)化的專用解決方案產品組合。

關鍵字: 嵌入式 機器學習 人工智能

在這個高速發(fā)展的時代,無論是健身、競技、興趣活動,還是康復訓練,對身體表現(xiàn)的感知與理解,正成為提升表現(xiàn)、實現(xiàn)突破的關鍵。如今,先進技術正為我們架起一座橋梁,將每一次身體活動轉化為有價值的洞察,幫助我們更聰明地訓練、更高效...

關鍵字: 傳感器 機器學習 IMU

在科技飛速發(fā)展的當下,邊緣 AI 正經歷著一場深刻的變革。從最初的 TinyML 微型機器學習探索低功耗 AI 推理,到邊緣推理框架的落地應用,再到平臺級 AI 部署工具的興起以及垂類模型的大熱,我們已經成功實現(xiàn)了 “讓...

關鍵字: 機器學習 邊緣 AI 無人機

在AI算力需求指數(shù)級增長的背景下,NVIDIA BlueField-3 DPU憑借其512個NPU核心和400Gbps線速轉發(fā)能力,為機器學習推理提供了革命性的硬件卸載方案。通過將PyTorch模型量化至INT8精度...

關鍵字: PyTorch 機器學習 DPU

中國,北京,2025年7月17日——隨著AI迅速向邊緣領域挺進,對智能邊緣器件的需求隨之激增。然而,要在小尺寸的微控制器上部署強大的模型,仍是困擾眾多開發(fā)者的難題。開發(fā)者需要兼顧數(shù)據(jù)預處理、模型選擇、超參數(shù)調整并針對特定...

關鍵字: 邊緣AI 嵌入式 機器學習
關閉