摘 要:雖然Fortran常用來進(jìn)行科學(xué)計(jì)算,但是面對計(jì)算量大的程序仍然很耗時。通常人們用MPI進(jìn)行粗粒度的并行來 提高程序的運(yùn)行效率,近年來隨著GPU計(jì)算能力的提高,將程序進(jìn)行細(xì)粒度GPU并行化成為一種趨勢。文章基于NVIDIA公 司的CUDA框架,就Fortran程序向CUDA移植過程中的一些問題進(jìn)行總結(jié),并給出了相應(yīng)的解決方案。
泰克全棧式電源測試解決方案來襲,讓AI數(shù)據(jù)中心突破性能極限
linux驅(qū)動開發(fā)之驅(qū)動應(yīng)該怎么學(xué)
Python使用培訓(xùn)
野火F429開發(fā)板-挑戰(zhàn)者教學(xué)視頻(提高篇)
PADS 9.5 pcb視頻零基礎(chǔ)入門實(shí)戰(zhàn)教程
內(nèi)容不相關(guān) 內(nèi)容錯誤 其它
本站介紹 | 申請友情鏈接 | 歡迎投稿 | 隱私聲明 | 廣告業(yè)務(wù) | 網(wǎng)站地圖 | 聯(lián)系我們 | 誠聘英才
ICP許可證號:京ICP證070360號 21ic電子網(wǎng) 2000- 版權(quán)所有 用戶舉報(bào)窗口( 郵箱:macysun@21ic.com )
京公網(wǎng)安備 11010802024343號