AMD APU開(kāi)啟異構(gòu)計(jì)算,實(shí)現(xiàn)CPU、GPU徹底融合
微處理器廠商AMD宣布Fusion處理器將徹底融合CPU與GPU。Fusion是AMD的旗艦處理器,整合了x86處理器和圖形處理器。AMD公司院士Phil Rogers在華盛頓貝爾維尤舉行的Fusion開(kāi)發(fā)者大會(huì)的一個(gè)主題演講中宣布了此消息。AMD高級(jí)副總裁、產(chǎn)品部門(mén)總經(jīng)理Rick Bergman宣布正式發(fā)布A系列APU芯片“Llano”。
(你或許知道雙核、四核甚至多核CPU,那你是否了解APU?APU的英文全稱(chēng)為“Accelerated Processing Unit”,意思是加速處理器。這是AMD給Fusion APU取的一個(gè)新名字,代表著它將CPU和GPU合二為一,可同時(shí)執(zhí)行串行計(jì)算和并行計(jì)算,為大量應(yīng)用提供加速。)
Fusion的早期樣片基于AMD內(nèi)部開(kāi)發(fā)的x86處理器和GPU。但AMD顯然向著更抽象的層面前進(jìn),相信自己可以讓多加硬件和軟件廠商加入進(jìn)來(lái),開(kāi)啟異構(gòu)計(jì)算(heterogeneous computing)。AMD將Fusion品牌變成開(kāi)放的Fusion系統(tǒng)架構(gòu),通過(guò)一套規(guī)范讓芯片制造商整合多種CPU和GPU,并提供一套高效的編程模型。
這項(xiàng)進(jìn)展可能意味著ARM內(nèi)核也能成為Fusion架構(gòu)的一部分,不過(guò)Rogers在介紹開(kāi)放平臺(tái)計(jì)劃時(shí)沒(méi)有明確提到ARM。
Rogers演講的重點(diǎn)是AMD希望創(chuàng)造一套讓不同的CPU、GPU組合像統(tǒng)一的處理引擎一樣工作的架構(gòu),在提供更高性能的同時(shí)消耗更少的電力。
Rogers也談到了單核到多核再到異構(gòu)多核計(jì)算的歷史趨勢(shì),他將Fusion系統(tǒng)架構(gòu)描繪成一個(gè)“開(kāi)放平臺(tái)”,并補(bǔ)充說(shuō)虛擬ISA規(guī)范(FSAIL)、內(nèi)存模型和分配機(jī)制也會(huì)隨之發(fā)布。
Rogers說(shuō):“Fusion系統(tǒng)架構(gòu)的ISA是CPU、GPU中立的。這很重要,因?yàn)槲覀冋谒蓄I(lǐng)域邀請(qǐng)合作伙伴加入:其它硬件廠商實(shí)現(xiàn)FSA、加入平臺(tái);操作系統(tǒng)公司全面支持所有功能、提供完整的性能和服務(wù)質(zhì)量;工具和中間件公司提供工具基礎(chǔ)來(lái)開(kāi)發(fā)、優(yōu)化用于這個(gè)平臺(tái)的程序。”
Rogers還補(bǔ)充說(shuō)未來(lái)將會(huì)成立一個(gè)FSA評(píng)估委員會(huì)指導(dǎo)架構(gòu)的進(jìn)化,讓所有參與者都能在決定發(fā)展方向上具有發(fā)言權(quán)。
統(tǒng)一的內(nèi)存和編程模型
Rogers說(shuō)目前的異構(gòu)多核架構(gòu)被編程模式和通信開(kāi)銷(xiāo)所束縛,“好消息是Fusion系統(tǒng)架構(gòu)打破這種了這些束縛。我們正在向架構(gòu)時(shí)代前進(jìn)。我們將GPU變成一個(gè)同等的處理器而不僅僅是一個(gè)器件”。
Rogers描繪了一個(gè)路線圖,其中有對(duì)C++功能的支持、統(tǒng)一地址空間、支持嵌套的數(shù)據(jù)并行模型、在CPU和GPU之間實(shí)現(xiàn)低延時(shí)任務(wù)分配的用戶模式調(diào)度機(jī)制以及搶占和上下文切換。
這個(gè)過(guò)程中也會(huì)實(shí)現(xiàn)自動(dòng)低平衡。此外,具體的FSA增強(qiáng)會(huì)得到OpenCL、DirectCompute等新編程語(yǔ)言和接口的支持。接下來(lái)還要為CPU、GPU的組合提供增加雙向電源管理。不過(guò)Rogers強(qiáng)調(diào),最關(guān)鍵的是創(chuàng)建統(tǒng)一的內(nèi)存地址空間,讓CPU和GPU完全共享內(nèi)存以實(shí)現(xiàn)無(wú)縫的運(yùn)作。
在這次技術(shù)性演講中沒(méi)有說(shuō)明的是AMD作為Fusion系統(tǒng)架構(gòu)實(shí)現(xiàn)者與貢獻(xiàn)者之一,如何從Fusion的發(fā)展中獲利。
AMD Llano APU技術(shù)解析
今年初,AMD率先發(fā)布了低電壓版APU——E系列(研發(fā)代號(hào):Zacate)和C系列(研發(fā)代號(hào):Ontario)。雖然這兩款處理器發(fā)布之后的市場(chǎng)反響都比較不錯(cuò),但是僅憑低電壓APU肯定是不能在市場(chǎng)中獲得更多的主動(dòng)權(quán)。因此,AMD在半年之后推出了代號(hào)為L(zhǎng)lano的A系列APU,很顯然AMD這次的矛頭直指英特爾的SandyBridge處理器。
眾所周知,“融合”概念最早是由AMD提出,而英特爾卻搶先于AMD推出了融合圖形芯片的處理器。雖然英特爾率先推出了整合顯卡的Core i5/i3處理器,不過(guò),正如最初的Pentium D雙核處理器一樣,英特爾這種“CPU+GPU”的設(shè)計(jì)具有兩個(gè)獨(dú)立的芯片,僅僅是兩個(gè)功能模塊的簡(jiǎn)單疊加,屬于一種過(guò)渡方案,并非原生的單芯片解決方案。在臥薪嘗膽了兩年之后,AMD終于厚積薄發(fā),推出了Llano的A系列APU。AMD的APU則是采用更先進(jìn)的原生方案——將CPU和GPU內(nèi)核完全融為一體的單芯片方案,這樣讓內(nèi)核之間的數(shù)據(jù)交換效率更高。
此次AMD一共發(fā)布了七款A(yù)PU,包括A4、A6和A8,從型號(hào)上來(lái)看,它們和英特爾的i3、i5和i7在數(shù)字上有著驚人的對(duì)稱(chēng),不知道這是巧合還是AMD故意所為。和英特爾的SandyBridge處理器一樣,此次發(fā)布的所有AMD Llano A系列APU均配置了AMD HD6400以上系列顯示核芯,并且根據(jù)級(jí)別的不同,顯卡性能也有所區(qū)別。另外,最高級(jí)別的A8采用的是AMD Radeon HD 6620G,單從型號(hào)上來(lái)看,這款顯卡的性能應(yīng)該不低。
AMD LlanoAPU全系產(chǎn)品
Fusion APU主要由x86架構(gòu)的CPU核心(最先上市的Ontario和Zacate APU處理器將基于“Bobcat”架構(gòu))、DirectX 11 SIMD引擎陣列、UVD高清視頻引擎、數(shù)據(jù)總線和DDR3內(nèi)存控制器等幾個(gè)模塊封裝在一個(gè)核心內(nèi)構(gòu)成。CPU和GPU各司其職,各自分別擁有獨(dú)立緩存。 CPU和GPU通過(guò)切換開(kāi)關(guān)互相連接,而整個(gè)APU內(nèi)部的各個(gè)組件之間通過(guò)HyperTransport總線連接成一個(gè)整體。CPU和GPU可以直接訪問(wèn) 存儲(chǔ)器,CPU和內(nèi)存之間,以及GPU和內(nèi)存之間均使用交叉開(kāi)關(guān)進(jìn)行連接,并且CPU和GPU可通過(guò)共享內(nèi)存進(jìn)行數(shù)據(jù)交換。APU這一設(shè)計(jì)的最大優(yōu)勢(shì)是可 以消除現(xiàn)有AMD平臺(tái)上各部分之間的互連瓶頸。在目前的AMD整合平臺(tái)上,原本位于北橋芯片的總線控制器和內(nèi)存控制器都已經(jīng)集成到CPU內(nèi)部,但是內(nèi)存控 制器與內(nèi)存之間的帶寬僅有17GB/s左右,北橋與集成顯卡之間的帶寬更是僅僅只有7GB/s左右,這已成為瓶頸所在。更為嚴(yán)重的是,集成顯卡與內(nèi)存通信 時(shí)還需要繞道北橋部分,增加了通信延時(shí)。AMD APU在將所有這些功能模塊全部整合到一塊晶片后,將可以提升各組件之間的帶寬。APU內(nèi)部的GPU圖形陣列、UVD解碼引擎與北橋模塊及內(nèi)存控制器之間 的通道高達(dá)27GB/s,內(nèi)存控制器和內(nèi)存之間的帶寬也同樣達(dá)到了27GB/s。另外,GPU與內(nèi)存之間也可以直接通信,帶寬增加了三倍,大大提高了GPU的執(zhí)行效率。
更強(qiáng)的整數(shù)運(yùn)算性能
盡管Fusion APU是一個(gè)全新的CPU和GPU的融合方案,GPU部分將采用與目前AMD Radeon HD 6300M/6250M相同級(jí)別的圖形核心,除了支持DirectX 11外,還能通過(guò)OpenCL支持GPU加速運(yùn)算。Fusion APU內(nèi)核架構(gòu)最大的亮點(diǎn)是引入了全新的“Bobcat”架構(gòu)。
Bobcat是AMD全新架構(gòu)的新一代處理器核心,與Bulldozer一樣,Bobcat也將整數(shù)運(yùn)算執(zhí)行單元和浮點(diǎn)單元分別獨(dú)立開(kāi)來(lái),只不過(guò) Bobcat內(nèi)核的整數(shù)運(yùn)算“簇”比Bulldozer更少。
注:整數(shù)運(yùn)算“簇”
Bulldozer的內(nèi)核引入了靈活的模塊化設(shè)計(jì):在現(xiàn)有的設(shè)計(jì)中,每個(gè)物理核心對(duì)應(yīng)單一獨(dú)占的整數(shù)運(yùn)算單元和128bit浮點(diǎn)運(yùn)算單元。而在 Bulldozer架構(gòu)中,每個(gè)物理核心具有兩個(gè)整數(shù)運(yùn)算單元和一個(gè)共享的256bit的浮點(diǎn)運(yùn)算單元。同時(shí),這個(gè)256bit的浮點(diǎn)運(yùn)算單元可以根據(jù)需 要拆分為2個(gè)128bit的浮點(diǎn)運(yùn)算單元,供兩個(gè)整數(shù)運(yùn)算單元搭配使用;或是以1個(gè)256bit浮點(diǎn)運(yùn)算單元的模式供某個(gè)整數(shù)單元獨(dú)占。這樣一個(gè)單獨(dú)的單 元被AMD稱(chēng)為“核心模塊”,這也就是Bulldozer所謂“1.5核”說(shuō)法的由來(lái)。而當(dāng)多個(gè)Bulldozer處理器并聯(lián)時(shí)(這在服務(wù)器領(lǐng)域幾乎是必 然的),兩個(gè)“核心模塊”組成的“簇”便成為了AMD集群多線程技術(shù)中的基本單位。而B(niǎo)obcat處理核心中的“核心模塊”則只包含了一個(gè)整數(shù)單元和一個(gè) 浮點(diǎn),并不支持集群多線程技術(shù),故每?jī)蓚€(gè)核心模塊才只擁有一個(gè)“簇”單元。簡(jiǎn)單來(lái)說(shuō),“簇”在這里被定義為整數(shù)計(jì)算能力,每?jī)蓚€(gè)整數(shù)單元等同于一個(gè) “簇”。
AMD為什么要在核心設(shè)計(jì)中單獨(dú)增加整數(shù)單元的數(shù)目?這與AMD的異構(gòu)計(jì)算策略不無(wú)關(guān)系。簡(jiǎn)單來(lái)說(shuō),現(xiàn)有的GPU具有遠(yuǎn)遠(yuǎn)強(qiáng)于CPU的浮點(diǎn)計(jì)算能 力。在AMD提出的GPU與CPU協(xié)同計(jì)算的平臺(tái)戰(zhàn)略下,與其事倍功半地提升CPU的浮點(diǎn)計(jì)算能力,不如將浮點(diǎn)計(jì)算交與GPU完成。在這種情況下,整數(shù)計(jì) 算能力將成為制約整個(gè)平臺(tái)性能的瓶頸,那么,有意識(shí)地提升APU的整數(shù)計(jì)算能力無(wú)疑就是一種必然的選擇。
上圖左為Bobcat的一個(gè)“簇”,它的整數(shù)單元(INT)只相當(dāng)于Bulldozer(上圖右)的半個(gè)“簇”。
Fusion APU能否在移動(dòng)市場(chǎng)掀起波瀾
Bergman表示:“AMD A系列APU對(duì)于AMD而言具有拐點(diǎn)意義,它可能是自微處理器面世以來(lái)業(yè)界最大的架構(gòu)變革。此產(chǎn)品的推出將使筆記本和個(gè)人電腦擁有前所未有的圖形和視頻性能,將為用戶帶來(lái)全新計(jì)算體驗(yàn)。從今天開(kāi)始,我們將為廣大的主流用戶帶來(lái)獨(dú)顯性能。”
Fusion APU是一款真正將CPU和GPU融合在一起的產(chǎn)品,它的誕生將統(tǒng)治軟件業(yè)界的x86 CPU與針對(duì)現(xiàn)代負(fù)載進(jìn)行優(yōu)化的GPU緊密融合在一起,并將兩者各自的優(yōu)勢(shì)發(fā)揚(yáng)光大。尤其對(duì)于移動(dòng)平臺(tái)來(lái)說(shuō),APU的利好是顯而易見(jiàn)的,高集成化可大幅度降低筆記本內(nèi)部設(shè)計(jì)的難度,并可有效提升其散熱效率,降低整機(jī)的功耗,提升續(xù)航時(shí)間。所以APU的出現(xiàn)將會(huì)帶出一種全新的筆記本內(nèi)部架構(gòu),影響深遠(yuǎn),符合更低能耗、更低成本的效果,符合節(jié)約、低碳、環(huán)保的時(shí)代主題。尤其在AMD將其定義為“APU價(jià)值和精華”的超輕薄筆記本電腦市場(chǎng)上,APU的問(wèn)世絕對(duì)是AMD的一枚重磅炸彈。最低低于1W的功耗設(shè)計(jì),以及不到現(xiàn)今產(chǎn)品一半的核心面積實(shí)現(xiàn)90%的性能水平。
麥格理證券研究公司(Macquarie Equities Research)分析師Shawn Webster表示,通過(guò)新近發(fā)布的Llano和Bulldozer處理器,AMD將在桌面PC處理器市場(chǎng)贏得份額,除非英特爾采取降價(jià)措施。
AMD是否有機(jī)會(huì)在超輕薄市場(chǎng)逐步建立起自己的非對(duì)稱(chēng)優(yōu)勢(shì),并最終在其他市場(chǎng)上對(duì)英特爾形成挑戰(zhàn)?業(yè)界將拭目以待。
------來(lái)源:EET
附原文: AMD makes Fusion CPU, GPU agnostic Peter Clarke Microprocessor vendor Advanced Micro Devices Inc. has declared that Fusion, its flagship processor project whereby it has combined x86 and graphics processors, will be CPU and GPU agnostic. The announcement was made as part of a keynote at the Fusion Developers Summit, being held in Bellevue, Washington, by Phil Rogers, AMD Corporate Fellow. The early examples of Fusion have been based on x86 processor and GPU cores developed internally by AMD. However, AMD is clearly heading for a higher level of abstraction and believes it can do better by letting multiple hardware and software companies join with it as it tries to enable heterogeneous computing. It is effectively turning the Fusion marketing brand into the open Fusion System Architecture with a specification that enables chipmakers to combine multiple CPUs and GPUs and preserve an efficient programming model. The development is likely to allow ARM cores to be used as part of the Fusion architecture although Rogers did not mention ARM explicitly as he laid out the open-platform plan for Fusion. The main thrust of Roger‘s keynote was that AMD wants to create an architecture whereby different combinations of CPU and GPU processor cores operate as a unified processing engine that delivers both higher performance and lower power consumption compared with today’s variants. Having discussed the historical trends from single- to multicore and on to heterogeneous multicore computing it was about half-way through the talk that Rogers described the Fusion System Architecture as an “open platform” and added that this meant the virtual ISA specification, known as FSAIL, the memory model the despatch mechanism would be published. Rogers said: “The Fusion system architecture is ISA agnostic for both CPUs and GPUs. This is very important because we‘re inviting partners to join us in all areas; other hardware companies to implement FSA and join in the platform; operating systems companies to fully embrace all of the features and deliver its full performance and quality of service; tools and middleware companies to provide the tool infrastructure to develop, optimize and debug the programs that will run on this platform.” He added that an FSA review committee would be formed to guide the evolution of the architecture and to allow all participants a voice in its direction. unified memory and programming models Rogers said that current heterogeneous multicore architectures are currently constrained by the programming model and communications overheads. “The good news is the Fusion System Architecture blows away both of these constraints,” he said. “Where we’re headed is the architected era. We make the GPU into a peer processor rather than a device,” he said Rogers outlined a roadmap that includes support for C++ features, unification of the address space, support for nested data parallelism, user-mode scheduling for lower latency task dispatch between CPUs and GPUs, and the addition of pre-emption and context switching. Automated lower balancing between CPU and GPU is part of that progress, according to Rogers. In addition, specific FSA enhancements will be supported by newer programming languages and interfaces such as OpenCL and DirectCompute. One of the next steps will be the addition of bi-directional power management to CPU, GPU combinations. But the key is the creation of a unified memory address space and fully coherent memory shared by the CPU and GPU so they operate seamlessly together, Rogers said. What was not made clear in what was essentially a technical presentation is how AMD, as one of a number of implementors and contributors to the Fusion System Architecture will make its money from the development of Fusion. LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。 在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過(guò)流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。 LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問(wèn)題卻十分常見(jiàn),不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問(wèn)題,需從設(shè)計(jì)、生... 根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。 電動(dòng)汽車(chē)(EV)作為新能源汽車(chē)的重要代表,正逐漸成為全球汽車(chē)產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車(chē)的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車(chē)的動(dòng)力性能和... 在現(xiàn)代城市建設(shè)中,街道及停車(chē)場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域... LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。 在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問(wèn)題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周?chē)娮釉O(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來(lái)解決L... 開(kāi)關(guān)電源具有效率高的特性,而且開(kāi)關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源 LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。