當前位置：首頁 > 智能硬件 > 人工智能AI

基于神經網絡的人工智能設計

時間：2020-06-13 11:24:01

關鍵字： AI 神經網絡

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 近幾年，深度學習在人工智能、機器學習中取得了飛躍式的突破，特別是在語音識別和圖像識別等領域［1-3］。其中，深度神經網絡由于結構類似于生物神經網絡，因此擁有高效、精準抽取信息深層隱含特征的能力和

近幾年，深度學習在人工智能、機器學習中取得了飛躍式的突破，特別是在語音識別和圖像識別等領域［1-3］。其中，深度神經網絡由于結構類似于生物神經網絡，因此擁有高效、精準抽取信息深層隱含特征的能力和能夠學習多層的抽象特征表示，且能夠對跨域、多源、異質的內容信息進行學習等優(yōu)勢，可以一定程度上處理推薦系統(tǒng)稀疏性、新物品、可擴張性等問題，這為推薦系統(tǒng)解決固有問題帶來了新的機遇。

本文提出了基于深度神經網絡結合多用戶-項目、協(xié)同過濾的推薦模型（Multi-View-CollaboraTIve Filtering integraTIng Deep Neural Network，MV-CFiDNN）［4-6］，基于深度神經網絡理論，提取用戶、項目信息的深層隱含特征并自學習、優(yōu)化提取模型，最后結合多用戶-項目、協(xié)同過濾（CollaboraTIve Filtering）提供廣泛的個性化推薦。

1 深度神經網絡推薦模型

基于深度學習的推薦系統(tǒng)通過將用戶和項目的各類原始數據信息提供給輸入層，在隱含層通過神經網絡學習模型進行用戶、項目的隱特征學習及抽取，最后通過學習隱表示實現用戶、項目推薦［7-8］?；谏疃壬窠浘W絡框架的兩次自學習并結合協(xié)同過濾的CFiDNN框架如圖1所示。CFiDNN框架兩大核心為：候選生成網絡融合協(xié)同過濾與排名網絡結合協(xié)同過濾。

其中，候選集產生以用戶在瀏覽歷史記錄中的提取特征作為輸入信息，然后基于多源數據庫檢索到與用戶相關的一個數據集，這一數據集就是候選集。這部分候選集通過協(xié)同過濾（CF）實現廣泛個性化。再通過用戶、項目的多類特征源學習計算相似性，實現最小排名集，最后基于協(xié)同過濾實現推薦。

1.1 候選集生成模塊

對于候選集生成，首先，將用戶瀏覽及搜索項目等歷史記錄信息映射為向量，然后對其求平均值獲取定長表示；并且，輸入用戶地理信息特征值優(yōu)化個性化推薦效果，二值性和連續(xù)性特征值通過歸一化得到［0，1］范圍。其次，把所有輸入特征值拼接到同一個向量，并且把拼接后的向量輸予激活函數處理。最后，通過神經網絡訓練輸給Softmax進行分類，通過訓練的特征與源項目進行相似度計算，獲取相似度最高的N個項目作為候選模塊中的候選集，圖2為候選生成結構圖。

基于生成的候選集協(xié)同過濾提供廣泛的個性化，組合基于用戶-項目相關度評價實現精準、實時、個性化推薦。

候選集生成部分是基于多源異構數據庫中學習選擇與用戶相關度較高的項目，對于預測用戶U，其瀏覽某一個信息的概率為：

其中，U是用戶特征值，V表示多源異構數據庫，vi表示數據庫中第i個項目的特征值，U與vi向量擁有相等長度，它兩通過點積在隱層全連接實現。

1.2 排序生成模塊

排序生成結構與候選生成結構類似，區(qū)別在于排序生成是對候選生成集升級細致分類排序。與傳統(tǒng)排序抽取特征值類似，神經網絡排序也是通過拼接大量用戶、項目相關特征值（文本ID、瀏覽時長等）。特征值的處理與候選生成類似，都基于向量化，區(qū)別在于排序生成網絡最后通過加權邏輯回歸訓練，給前期產生的候選集再評分，評分較高的K個項目返回給用戶或通過協(xié)同過濾實現個性化推薦［8-10］。圖3為排序生成結構圖。

設定部分Softmax分類過程：首先，對于候選生成集或排序生成列表的訓練過程，通過對負樣本類別采用實際類別計算將數量減小到數千；其次，在推薦階段，不計Softmax歸一化，將項目評分轉化為點積空間的最近鄰尋找或協(xié)同過濾根據相關度計算；最后，選取與用戶U相關度最高的K項作為候選集或排序列表，然后通過協(xié)同過濾個性化推薦，把信息推薦給用戶。

1.3 多用戶—項目模型

基于多用戶、多項目的多源異構特征結合兩次深度神經網絡學習，從而實現個性化推薦。其實現思想為：首先，將原始特征值向量化后映射為用戶、項目兩個通道；然后利用深度神經網絡模型把用戶、項目信息向量映射到一個隱空間；最后，通過評估相似度（如余弦相似度法）把隱空間的用戶、項目進行相關度等排名、匹配，從而實現精準、個性化推薦。圖4為多用戶-項目DNN（Deep Neural Network）模型結構［11-12］。

在用戶視角，利用其瀏覽歷史、搜索（Search tokens）、位置信息、二值性（登錄與否、性別）和連續(xù)性（年齡）、觀看時長等作為源特征值輸入xu，然后通過深度神經網絡學習模型學習輸出隱表示yu。在項目視角，利用項目的描述、標簽、類型等作為源特征值輸入xi，通過深度神經網絡學習模型學習輸出隱表示yi，其中模型擁有多個用戶、項目，分別為m、N。用戶視角DNN模型為fu（xu，wu），第i個項目視角DNN模型為fi（xi，wi）。若擁有M個樣本{（xu，j，xa，j）}，0≤j≤M，（xu，j，xa，j）是用戶u與項目a的交互，利用用戶、項目的擬合交互記錄進行調參學習：

通過模型訓練、學習之后獲得的用戶隱表示yu與項目隱表示yi，利用在隱空間中計算用戶與項目的相關度、排名，選擇相關度排序較高的k項目以及源數據庫協(xié)同過濾實現精準、個性化推薦。

1.4 特征值向量化

特征值向量化是通過詞組嵌入，將特制文本映射到w維空間向量。首先，把用戶、項目所有相關聯(lián)特征值分別合并，并對特征值量化為評分數據然后求其平均值，即對多源異構原始數據進行評分式數據處理及歸一化。

（1）用戶特征數據為：

1.5 全連接層

全連接層（隱層）輸入數據為用戶、項目源特征值向量化后的值，設隱含層共m個神經元，通過隱含層ReLU激活函數處理后，獲得向量ui，就是用戶useri隱特征值，同理，項目itemj的隱特征值向量為vj，計算過程如下：

1.6 矩陣分解

最后，利用Adam深度學習優(yōu)化方式對預測與真實評分進行擬合［13］，對于一些擁有評分的項目，使預測最大可能接近真實，由此學習推薦，對新物品實現個性化推薦（未評分項目預測真實評分無限接近預測值）。

2 實驗仿真及分析

2.1 實驗環(huán)境

算法性能分析的實驗環(huán)境以Windows Server2012 R2操作系統(tǒng)為實驗支撐，相關配置為：Intel Xeon Silver 4116 CPU處理器，編程語言Python，128 GB內存，雙GPU。編譯環(huán)境在Anaconda的Jupyter Notebook中實現并采用MATLAB進行仿真。

2.2 數據集合

本文通過2個真實、實時數據集，對深度神經網絡融合協(xié)同過濾推薦模型進行評估，數據集分別為Amazon Movies and TV（AMT）評論評分與Amazon Clothing（AC）視頻評論、評分。數據包括用戶ID、物品ID及用戶評論、評分。評分值為1~5，值越大用戶喜好度越高。同時，實驗數據按需求進行訓練集TrainSet與測驗集TestSet劃分，且二者沒有交集。

2.3 評價標準

本文提出的深度神經網絡融合協(xié)同過濾推薦模型通過用戶與項目的各類歷史記錄中抽取隱特征，然后對特征值進行學習預判、排序。因此本文應用均方根誤差（RMSE）作為評價此模型的指標，通過學習特征模型與真實特征計算偏差，并求平方，然后與預測數據量N做比值平方根，計算公式如下：

2.4 實驗對比

實驗通過3個有效模型進行比較，分別為ProbabilisTIc Matrix Factorization（PMF）、LibMF和DNNMF。

2.5 執(zhí)行時間對比分析

深度神經網絡（DNN）推薦算法與傳統(tǒng)協(xié)同過濾（CF）運行時間對比：實驗處理數據為AMT、AC真實數據，大小為1.88 GB。深度神經網絡輸入節(jié)點為1 024個，隱含層18個，輸出節(jié)點1 024個，Spark集群節(jié)點為3，比較深度神經網絡訓練與傳統(tǒng)協(xié)同過濾處理數據集的耗時。實驗結果如圖5所示，其中user表示用戶測試數據集耗時，item表示商品測試數據集耗時。顯然，DNN執(zhí)行效率更高。

2.6 實驗結果與分析

實驗在2個真實數據集下通過本文提出的MV-CFi-DNN模型進行計算評估，同時用RMSE來對模型進行評估預測，在相同實驗環(huán)境與同一數據前提下，將MV-CFi-DNN與PMF、LibMF做比較分析。

參數設置為：用戶、項目特征值權重分別為α=1，β=0.5，MV-CFiDNN模型學習率為lr=0.000 65，用戶、項目隱特征正則化為λuser=λitem=λ，深度神經網絡神經元數為1 026個。

為了將MV-CFiDNN模型與PMF、LibMF模型對比，把2個真實數據集隨機分為80%的TrainSet與20%的TestSet，且兩者沒有交集，同時把TestSet中的20%數據集隨機用于驗證，用來調整模型參數。

從圖6可知，通過在2個真實數據集中測試后，PMF、LibMF的RMSE值相差不大，但與MV-CFiDNN模型的RMSE值有一定差異，表明深度神經網絡融合多用戶-項目、協(xié)同過濾模型對于特征值抽取有很好效果。通過實驗結果可以看出，本文提出的深度神經網絡融合多用戶-項目協(xié)同過濾模型（MV-CFiDNN）的RMSE值與PMF、LibMF模型比較，都有下降，說明MV-CFiDNN模型能夠解決傳統(tǒng)算法模型的稀疏性、新物品等問題。

本站聲明：本文章由作者或相關機構授權發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者，如若文章內容侵犯您的權益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或將催生出更大的獨角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關鍵字： AWS AN BSP 數字化

[美通社全球TMT]

人工智能驅動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字：汽車人工智能智能驅動 BSP

[美通社全球TMT]

從容應對未知風險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務中斷的風險，如企業(yè)系統(tǒng)復雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性，提升韌性，成...

關鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復蘇！騰訊、網易等巨頭縮減在日本投資

8月30日消息，據媒體報道，騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術

8月28日消息，今天上午，2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行，華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字：華為 12nm EDA 半導體

[通信先鋒]

華為張平安：數字世界話語權最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數據產業(yè)博覽會上，華為常務董事、華為云CEO張平安發(fā)表演講稱，數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務公布2024年中期業(yè)績

要點：有效應對環(huán)境變化，經營業(yè)績穩(wěn)中有升落實提質增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務引領增長以科技創(chuàng)新為引領，提升企業(yè)核心競爭力堅持高質量發(fā)展策略，塑強核心競爭優(yōu)勢...

關鍵字：通信 BSP 電信運營商數字經濟

[美通社全球TMT]

NVI技術創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。活動現場 NVI技術創(chuàng)新聯(lián)...

關鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]