當(dāng)前位置：首頁 > 智能硬件 > 智能硬件

基于CC—NUMA的多處理器系統(tǒng)研究

時(shí)間：2009-04-23 11:30:18

關(guān)鍵字：多處理器系統(tǒng)研究處理器系統(tǒng) BSP

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]對(duì)于多處理器系統(tǒng)，比較流行的有3種模式，對(duì)稱多處理(Symmetric Multiprocessing，SMP)模式、非均勻存儲(chǔ)訪問(Non Uniform Memory Access，NUMA)模式、大規(guī)模并行處理(Massively Parallel Processing，MPP)模式。SMP模

對(duì)于多處理器系統(tǒng)，比較流行的有3種模式，對(duì)稱多處理(Symmetric Multiprocessing，SMP)模式、非均勻存儲(chǔ)訪問(Non Uniform Memory Access，NUMA)模式、大規(guī)模并行處理(Massively Parallel Processing，MPP)模式。SMP模式即將2個(gè)或2個(gè)以上的同樣的處理器連接到一個(gè)共享的主存上。在SMP系統(tǒng)中，所有的處理器可以同時(shí)訪問同一個(gè)物理存儲(chǔ)器，即運(yùn)行同一個(gè)操作系統(tǒng)，因此也被稱為均勻性存儲(chǔ)訪問系統(tǒng)。這種結(jié)構(gòu)比較簡(jiǎn)單，但是由于其是共享存儲(chǔ)器，容易在訪存時(shí)產(chǎn)生系統(tǒng)瓶頸，可擴(kuò)展性也比較差。MPP是分布式存儲(chǔ)器模式，可擴(kuò)展性好，但是需要并行編程和并行編譯，在軟件系統(tǒng)構(gòu)建上比較復(fù)雜，使用不便。NUMA架構(gòu)將若干個(gè)單元通過專門的互聯(lián)設(shè)備聯(lián)結(jié)在一起組成分布式和共享內(nèi)存空間。每一個(gè)處理器可以訪問自己的存儲(chǔ)器，也可以訪問其他處理器或者共享的存儲(chǔ)器，所有訪存有遠(yuǎn)近、時(shí)延長短之分，稱為非均勻存儲(chǔ)訪問。在某個(gè)處理器訪問空間上比較遠(yuǎn)的存儲(chǔ)器時(shí)，會(huì)有很大的時(shí)延，為了緩解這個(gè)問題，通過高速緩存一致性使得處理器訪問存儲(chǔ)器的幾率大大降低，在某種程度上提高了系統(tǒng)效率，這種架構(gòu)稱為CC—NUMA即一致性緩存非均勻存儲(chǔ)訪問模式。這種架構(gòu)繼承了SMP和MPP系統(tǒng)的一些優(yōu)點(diǎn)，在處理器個(gè)數(shù)，內(nèi)存大小、I／O連接能力和帶寬上有很大的伸縮性，又保持了SMP系統(tǒng)單一操作系統(tǒng)、簡(jiǎn)單的應(yīng)用程序編程模式和易于管理的優(yōu)點(diǎn)。

1 CC—NUMA基本架構(gòu)
CC—NUMA架構(gòu)的系統(tǒng)最出名的莫過于SGI公司的ORIGIN系列，SGI公司很好的發(fā)展和擴(kuò)展了CC—NUMA技術(shù)，其基本架構(gòu)被廣泛應(yīng)用。圖1是其ORIGIN2000的基本原理圖，每一個(gè)節(jié)點(diǎn)擁有2個(gè)處理器，2個(gè)二級(jí)緩存，主存，用于互聯(lián)的HUB芯片，1個(gè)I／O接口，1個(gè)互聯(lián)網(wǎng)絡(luò)的路由器接口，它的每個(gè)節(jié)點(diǎn)可以看作是一個(gè)SMP，通過互聯(lián)網(wǎng)絡(luò)可擴(kuò)展至128個(gè)處理器的多處理器系統(tǒng)。Origin 2000的所有結(jié)點(diǎn)通過CrayLink高性能互聯(lián)網(wǎng)絡(luò)相互聯(lián)接，路由器是構(gòu)成CrayLink的基本單位，它包含6個(gè)端口，內(nèi)部采用交叉開關(guān)實(shí)現(xiàn)端口間的全互聯(lián)。每個(gè)路由器的2個(gè)端口用于聯(lián)接結(jié)點(diǎn)，其余4個(gè)端口實(shí)現(xiàn)路由器間的互聯(lián)，形成互聯(lián)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。該CrayLink的半分帶寬與結(jié)點(diǎn)個(gè)數(shù)成線性遞增關(guān)系，對(duì)任意2個(gè)結(jié)點(diǎn)，至少能提供兩條路徑，保證了結(jié)點(diǎn)間的高帶寬、低延遲聯(lián)接和互聯(lián)網(wǎng)絡(luò)的穩(wěn)定性和容錯(cuò)能力。

2 兩種比較新的架構(gòu)
    SGI公司的Origin系列多處理器系統(tǒng)是一種比較通用的架構(gòu)，但是還是比較復(fù)雜。后來，分別由Corepaq公司的Alpha EV7框架的處理器Alpha 21364和AMD公司的Opteron處理器組成的CC—NUMA架構(gòu)的多處理器系統(tǒng)簡(jiǎn)單很多，這兩種處理器都是針對(duì)多處理系統(tǒng)領(lǐng)域推出的，其有著特有的專為多處理器系統(tǒng)應(yīng)用設(shè)計(jì)的處理器結(jié)構(gòu)。
2．1 Alpha 21364處理器
    2000年，Compaq公司推出了Alpha處理器的第四代產(chǎn)品Alpha21364，這是一款RISC處理器，在當(dāng)時(shí)非常先進(jìn)，在業(yè)內(nèi)首次在處理器內(nèi)集成了內(nèi)存控制器，特別是它還有先進(jìn)的多處理互聯(lián)功能，在建造多處理器系統(tǒng)上很方便。
    21364的簡(jiǎn)化圖如圖2所示。21364是64位處理器，擁有1．5 MB的L2 CACHE，支持緩存一致性協(xié)議。內(nèi)部集成了2個(gè)RDRAM內(nèi)存控制器，在RDRAM中對(duì)于頁命中點(diǎn)對(duì)點(diǎn)的延遲是30 ns，加載應(yīng)用的延遲是75 ns，對(duì)應(yīng)高達(dá)12 GB／s的帶寬。最大的不同就是有一個(gè)路由器，有4個(gè)連接通道可與附近處理器相連，并與本地端口和I／O端口相連，每個(gè)連接通道提供6．2 GB／s的帶寬。
    21364的處理器問互聯(lián)總線提供了CC—NUMA多處理器架構(gòu)間的無粘合連接，如圖3所示。處理器間的二維拓?fù)浠ヂ?lián)架構(gòu)滿足了最遠(yuǎn)的處理器間的最小系統(tǒng)延遲設(shè)計(jì)。這種架構(gòu)可擴(kuò)展至128個(gè)處理器互聯(lián)。

2．2 Opteron處理器
    AMD公司在2001年推出了其第8代處理器K8架構(gòu)的Opteron處理器。Opteron處理器基于X86系統(tǒng)架構(gòu)并對(duì)其做了根本性改善，屬于64位處理器，并兼容32位X86處理器架構(gòu)。Opteron處理器集成了內(nèi)存控制器，降低了訪存延遲，加大了訪存帶寬。Hyper—Transport(超傳輸)互連控制器也被集成到Opteron處理器內(nèi)部，在處理器和I／O子系統(tǒng)之間提供了拓展性極強(qiáng)的數(shù)據(jù)連接帶寬。在Opteron處理器內(nèi)部的數(shù)據(jù)通道為雙向16位的通訊，可以達(dá)到1 600 MT／s(每秒百萬次傳送)的工作效率，可提供雙向?yàn)?．4 GB／s的帶寬。AMD Opteron處理器之間以及處理器同I／O子系統(tǒng)之間如何通過HyperTransport(超傳輸)技術(shù)進(jìn)行互連。處理器之間的互連采用的是一致性協(xié)議(CoherentProtocol)，相反I／O連接遵循的是非一致性協(xié)議(Non—coherent Protoco1)。集成了3個(gè)HyperTransport(超傳輸)互連控制器和1個(gè)內(nèi)存控制器的處理器，需要盡可能高效地把指令和數(shù)據(jù)信息發(fā)送到相關(guān)接口。為實(shí)現(xiàn)這一需求，系統(tǒng)采用了交叉通道架構(gòu)。
    圖4中展現(xiàn)了北橋架構(gòu)細(xì)節(jié)，包括交叉通道(XBar)、內(nèi)存管理器之間的路由指令和數(shù)據(jù)信息、3個(gè)HyperTransport(超傳輸)技術(shù)的連接和處理器自己的系統(tǒng)請(qǐng)求接口(System Request Interface，SRI)。
    現(xiàn)在對(duì)Opteron處理器組成的CC—NUMA系統(tǒng)的內(nèi)存訪問進(jìn)行分析。將內(nèi)存訪問分為本地訪問和遠(yuǎn)程訪問。如圖5所示為hops圖，處理器對(duì)本地存儲(chǔ)器的訪問，由于其無需經(jīng)過節(jié)點(diǎn)，訪問路程為O—hop(跳躍)，依次的處理器分別需要經(jīng)過1個(gè)和2個(gè)其他的處理器才能訪問遠(yuǎn)程存儲(chǔ)器，路程分別為1一 hop和2-hops。Opteron處理器支持在無其他任何芯片組連接的情況下支持無粘合地將至多8個(gè)處理器連接成CC—NUMA多處理器系統(tǒng)。如圖6 所示為8個(gè)處理器拓?fù)洌袑?個(gè)處理器連接成多處理器系統(tǒng)的兩種方案。在圖6中，提供兩條HyperTransport I／0通道，32 GB／s的對(duì)分帶寬，經(jīng)過計(jì)算其平均訪問路程為1．64 hops。圖6提供了4條HyperTransport I／O通道，25．6 GB／s的對(duì)分帶寬，1．71hops的平均訪問路程。這兩種方案各有所長，前者I／O帶寬雖然小于后者，但提供了更高的處理器間帶寬和更小的平均訪問路程，在訪問延遲上也相當(dāng)小，所以在總體性能上優(yōu)于后者。

3 新型架構(gòu)
考慮到以上兩種架構(gòu)所用的處理器具有特殊性，都有獨(dú)有的處理器間互聯(lián)總線，不能推廣到大部分處理器。而Origin2000的架構(gòu)過于復(fù)雜，也就失去了其普遍性。故在此，基于前幾種架構(gòu)，提出一種更加簡(jiǎn)單、通用的CC—NUMA框架，如圖7所示為一個(gè)四處理器的系統(tǒng)原理圖。

圖7中，整個(gè)系統(tǒng)完全是一個(gè)模塊化的架構(gòu)，各個(gè)模塊之間都是獨(dú)立的，包括CPU、內(nèi)存控制器、存儲(chǔ)器路由器、存儲(chǔ)器以及I／0系統(tǒng)。每個(gè)CPU有自己的CACHE、內(nèi)存控制器和可共享的本地存儲(chǔ)器，CPU可以直接訪問本地存儲(chǔ)器，也可以通過存儲(chǔ)器路由選擇存儲(chǔ)器，然后訪問遠(yuǎn)程存儲(chǔ)器。CACHE的一致性也通過存儲(chǔ)器路由實(shí)現(xiàn)。這樣，在CPU L2 CACHE比較大的情況下，CPU可以較少地訪問存儲(chǔ)器，或者可以很快地訪問本地存儲(chǔ)器，減少在訪問遠(yuǎn)程存儲(chǔ)器時(shí)的延遲。各處理器之間的互聯(lián)可以通過現(xiàn)有的各種總線完成，如PCI一E，RAPIDI／O等，這樣既利用了現(xiàn)有技術(shù)，又很方便，具體實(shí)現(xiàn)還在研究中。
    存儲(chǔ)器路由的選擇可以由高速FPGA實(shí)現(xiàn)，不同的FPGA可以擴(kuò)展到不同數(shù)量、類型的處理器，所以整個(gè)系統(tǒng)的擴(kuò)展性大大提高。
    系統(tǒng)帶寬取決于內(nèi)存控制器帶寬，其平均的訪問路程為1．5 hops，明顯低于前面幾種架構(gòu)的延遲。在總體性能上主要取決于FPGA路由器的性能。當(dāng)前的高速FPGA在頻率吞吐量上可以達(dá)到500 MHz以上的速度，在單引腳上可以達(dá)到6．5 Gb／s的傳輸，完全可以滿足存儲(chǔ)器路由的帶寬要求，并且其高頻率也可以有效控制整個(gè)系統(tǒng)的訪存延遲。
    整個(gè)系統(tǒng)可以快速地配置起來，并且可以擴(kuò)展。所用的處理器可以是X86架構(gòu)的處理器、PowerPc、MIPS處理器等，甚至一些嵌入式處理器也可以使用，真正達(dá)到了通用性。

4 結(jié) 語
多處理器系統(tǒng)的建構(gòu)是一個(gè)很復(fù)雜的工程，要想充分發(fā)揮硬件架構(gòu)的性能優(yōu)勢(shì)還需要操作系統(tǒng)及應(yīng)用程序的配合，不同的操作系統(tǒng)及應(yīng)用程序運(yùn)行在同樣的處理構(gòu)架上其性能表現(xiàn)也會(huì)大相徑庭。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

平安養(yǎng)老險(xiǎn)四川踐行"有溫度的金融" 助力構(gòu)建多層次養(yǎng)老保障體系

成都2022年10月19日 /美通社/ -- 近期，平安養(yǎng)老險(xiǎn)積極籌備個(gè)人養(yǎng)老金的產(chǎn)品設(shè)計(jì)和系統(tǒng)開發(fā)工作，發(fā)展多樣化的養(yǎng)老金融產(chǎn)品，推動(dòng)商業(yè)養(yǎng)老保險(xiǎn)、個(gè)人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險(xiǎn)等產(chǎn)品供給。搭養(yǎng)老政策東風(fēng) ...

關(guān)鍵字：溫度 BSP 東風(fēng) 大眾

[產(chǎn)業(yè)新聞]

「這空間很中國」重構(gòu)理想空間恒潔推進(jìn)國民美好生活品質(zhì)升級(jí)

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎(chǔ)單元，承載著生存與活動(dòng)的最基本功能。而對(duì)于理想空間的解構(gòu)意義卻在物理性容器之外，體現(xiàn)出人們對(duì)于空間和生活深層關(guān)系的思考，同時(shí)也塑造著人與空間的新型連接...

關(guān)鍵字：溫度 BSP 智能化進(jìn)程

[產(chǎn)業(yè)新聞]

下好創(chuàng)新"先手棋"，安集科技功能性濕電子化學(xué)品持續(xù)發(fā)力

上海2022年10月19日 /美通社/ -- 10月17日晚間，安集科技披露業(yè)績(jī)預(yù)告。今年前三季度，公司預(yù)計(jì)實(shí)現(xiàn)營業(yè)收入7.54億元至8.33億元，同比增長60.24%至77.03%；歸母凈利潤預(yù)計(jì)為1.73億...

關(guān)鍵字：電子安集科技 BSP EPS

[產(chǎn)業(yè)新聞]

諾誠健華獲2022年度首批"北京市企業(yè)技術(shù)中心"認(rèn)定

北京2022年10月19日 /美通社/ -- 10月18日，北京市經(jīng)濟(jì)和信息化局發(fā)布2022年度第一批北京市市級(jí)企業(yè)技術(shù)中心創(chuàng)建名單的通知，諾誠健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。北京市企業(yè)技...

關(guān)鍵字： BSP ARMA COM 代碼

[產(chǎn)業(yè)新聞]

IDC：2022上半年浪潮超融合位列中國前三

北京2022年10月18日 /美通社/ -- 10月14日，國際數(shù)據(jù)公司（IDC）發(fā)布《2022Q2中國軟件定義存儲(chǔ)及超融合市場(chǎng)研究報(bào)告》，報(bào)告顯示：2022年上半年浪潮超融合銷售額同比增長59.4%，近5倍于...

關(guān)鍵字： IDC BSP 數(shù)字化數(shù)據(jù)中心

[產(chǎn)業(yè)新聞]

首都銀行（中國）行長林大鎰：現(xiàn)階段外資金融機(jī)構(gòu)更應(yīng)抓住中國市場(chǎng)機(jī)遇

上海2022年10月18日 /美通社/ -- 2022年9月5日，是首都銀行集團(tuán)成立60周年的紀(jì)念日。趁著首都銀行集團(tuán)成立60周年與首都銀行（中國）在華深耕經(jīng)營12年的“大日子”，圍繞作為外資金融機(jī)構(gòu)對(duì)在華戰(zhàn)略的構(gòu)想和業(yè)...

關(guān)鍵字：數(shù)字化 BSP 供應(yīng)鏈控制

[產(chǎn)業(yè)新聞]

上海通運(yùn)向半導(dǎo)體制造設(shè)備和精密儀器推出溫控集裝箱拓展運(yùn)輸服務(wù)

東京2022年10月18日 /美通社/ -- NIPPON EXPRESS HOLDINGS株式會(huì)社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團(tuán)公司上海通運(yùn)國際物流有限公司(Nipp...

關(guān)鍵字：溫控精密儀器半導(dǎo)體制造 BSP

[產(chǎn)業(yè)新聞]

成就智慧生活，第132屆廣交會(huì)打造中國智造"云展廳"

廣州2022年10月18日 /美通社/ -- 10月15日，第 132 屆中國進(jìn)出口商品交易會(huì)（"廣交會(huì)"）于"云端"開幕。本屆廣交會(huì)上高新技術(shù)企業(yè)云集，展出的智能產(chǎn)品超過140,...

關(guān)鍵字：中國智造 BSP 手機(jī) CAN

[快科技]

整活了！波士頓動(dòng)力機(jī)器人秀男團(tuán)舞：動(dòng)作整齊劃一

要問機(jī)器人公司哪家強(qiáng)，波士頓動(dòng)力絕對(duì)是其中的佼佼者。近來年該公司在機(jī)器人研發(fā)方面獲得的一些成果令人印象深刻，比如其開發(fā)的機(jī)器人會(huì)后空翻，自主爬樓梯等。這不，波士頓動(dòng)力又發(fā)布了其機(jī)器人組團(tuán)跳男團(tuán)舞的新視頻，表演的機(jī)器人包括...

關(guān)鍵字：機(jī)器人 BSP 工業(yè)機(jī)器人現(xiàn)代汽車

[產(chǎn)業(yè)新聞]

高端家電品牌G50峰會(huì) A.O.史密斯再獲行業(yè)兩大殊榮

南京2022年10月17日 /美通社/ -- 日前《2022第三屆中國高端家電品牌G50峰會(huì)》于浙江寧波落幕，來自兩百余名行業(yè)大咖、專家學(xué)者共同探討了在形勢(shì)依然嚴(yán)峻的當(dāng)下，如何以科技創(chuàng)新、高端化轉(zhuǎn)型等手段，幫助...

關(guān)鍵字： LINK AI BSP 智能家電