Xeon Phi加速處理器細(xì)節(jié):最多61核心、300W
六月份,Intel正式發(fā)布了首款基于IMC眾核架構(gòu)、22nm Knights Corner核心的加速處理器“Xeon Phi”,Larrabee借此重生,準(zhǔn)備與NVIDIA Tesla、AMD Fusion等等在高性能計(jì)算領(lǐng)域一較高下。不過(guò),Intel當(dāng)時(shí)并未公布太多技術(shù)細(xì)節(jié),規(guī)格上語(yǔ)焉不詳。
上周,Intel開(kāi)始向合作伙伴提供B0步進(jìn)的Xeon Phi芯片樣品,我們也得到了比較詳細(xì)的技術(shù)參數(shù)。
昨天——
Larrabee獨(dú)立顯卡項(xiàng)目失敗后,Intel并未放棄,而是撿起了“Aubrey Isle”核心與合作伙伴繼續(xù)試驗(yàn),而搭載此核心的擴(kuò)展卡代號(hào)“Knights Ferry”,2010年三月正式亮相,并稱之為“MIC”眾核架構(gòu)。
Aubrey Isle采用的是45nm工藝,32個(gè)核心,1MB一級(jí)緩存,8MB二級(jí)緩存,主頻1.2GHz,搭載2GB GDDR5顯存,位寬達(dá)到驚人的1024-bit,而且是環(huán)形總線設(shè)計(jì),熱設(shè)計(jì)功耗300W左右。
Knights Ferry擴(kuò)展卡可以執(zhí)行x86標(biāo)準(zhǔn)代碼,能提供750GFlops的單精度浮點(diǎn)性能,雙精度效率41-47%,也就是不到400GFlops。至于這塊卡出貨了多少,誰(shuí)也不清楚,反正難得一見(jiàn),畢竟只是個(gè)試驗(yàn)品。
2011年初,準(zhǔn)備采用22nm工藝的新核心“Knights Corner”出現(xiàn)了,BIOS、PCB、規(guī)格都有很多版本。A0步進(jìn)的有48、52、60個(gè)核心,1.5-1.9MB一級(jí)緩存,24-30MB二級(jí)緩存,顯存拋棄環(huán)形總線,位寬縮減到512-bit(待確認(rèn)),容量2、4、8GB GDDR5,等效頻率不過(guò)2.4-4.5GHz,主頻也只有1GHz,因?yàn)榧幢氵@樣熱設(shè)計(jì)功耗也有300W了。
60核心版本曾經(jīng)演示過(guò)1TFlops的單精度浮點(diǎn)性能,但雙精度比較慘淡,不足以成氣候。
Intel隨后準(zhǔn)備繼續(xù)發(fā)展B0、C1等新步進(jìn),并且計(jì)劃盡快出貨,以登上2013年六月的全球超級(jí)計(jì)算機(jī)五百?gòu)?qiáng)名單。
今天——
B0就是現(xiàn)在的步進(jìn)版本,ES2版工程樣品,進(jìn)步很大,引入了一些非常必要的功能特性,BIOS也做了全面完善。
核心數(shù)量為57、60、61個(gè)(很不規(guī)整的數(shù)字),一級(jí)緩存1.8-1.9MB,二級(jí)緩存28-30.5MB,顯存增加到3、6、8GB GDDR5。
頻率方面有多種不同設(shè)定,57核心3/6GB顯存的600-1100MHz,60/61核心8GB顯存的則是630-1050/1090MHz,顯存頻率達(dá)到了5000-5500MHz,帶寬超過(guò)300GB/s。
值得一提的是,Intel這次引入了Turbo動(dòng)態(tài)加速技術(shù),類似桌面上的睿頻,但具體多少個(gè)核心能加速到什么程度不詳。
熱設(shè)計(jì)功耗,57核心3GB顯存、60核心6GB顯存的是245W,57核心6GB、61核心8GB(兩種版本)的則是300W。
散熱方案有主動(dòng)風(fēng)扇、被動(dòng)靜音兩種,其中被動(dòng)靜音的用于自備大風(fēng)量的機(jī)架系統(tǒng),但也有完全無(wú)散熱的,用于自行安裝水冷等其它散熱器。順便說(shuō)一句,這些卡很重很重。
具體性能沒(méi)有實(shí)際數(shù)據(jù),Intel的內(nèi)部目標(biāo)是單精度2TFlops、雙精度1TFlops,從已知情況看難度不大。
C1步進(jìn)還沒(méi)出來(lái),會(huì)是什么樣子還有待觀察。
再往后,還有第二代“Knights Landing”,Intel對(duì)高性能計(jì)算的追求不會(huì)停歇