手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>AI>

Nvidia推出AI超級計算機(jī)與A100 PCIe卡

英偉達(dá)今天與世界上最快的計算機(jī)的最新列表同時發(fā)布了其Selene AI超級計算機(jī)。Nvidia還介紹了基于Ampere的A100 GPU的PCIe尺寸。

Nvidia的新型內(nèi)部AI超級計算機(jī)Selene加入了第55位Top500的行列,打破了能源效率壁壘。Selene憑借27.5雙精度Linpack petaflops,在ISC 2020數(shù)字會議的今天公布的最新Top500榜單上排名第七。Selene是榜單上性能最高的第二大行業(yè)系統(tǒng),僅次于Eni的 HPC5計算機(jī),后者以35.5 HPL petaflops(還使用Nvidia GPU)排名第六。

該Top500列表標(biāo)志著兩個行業(yè)系統(tǒng)進(jìn)入前十名,而Selene是第一個這樣做的內(nèi)部IT供應(yīng)商系統(tǒng)。英偉達(dá)內(nèi)部使用超級計算機(jī)來支持芯片設(shè)計和模型開發(fā),以及在機(jī)器人技術(shù),自動駕駛汽車,醫(yī)療保健和其他研究項目中的工作。

Selene是位于加利福尼亞州圣克拉拉的DGX SuperPOD,它由DGX A100尺寸內(nèi)的Nvidia的A100 GPU和AMD的Epyc Rome CPU驅(qū)動,并通過Mellanox HDR InfiniBand集群。Selene總共包含280臺DGX A100,總共容納2,240個A100 GPU和494臺Mellanox Quantum 200G InfiniBand交換機(jī),提供56 TB / s的網(wǎng)絡(luò)結(jié)構(gòu)。該系統(tǒng)包括7 PB的全閃存網(wǎng)絡(luò)存儲。

營銷高級副總裁吉拉德·謝納(Gilad Shainer)說,Selene是使用SHARP通過網(wǎng)絡(luò)和GPU的垂直集成構(gòu)建的 ,他是通過收購Mellanox來到英偉達(dá)的。他在為媒體舉行的簡短預(yù)告中說:“ SHARP是網(wǎng)絡(luò)上進(jìn)行數(shù)據(jù)縮減的引擎,這在傳統(tǒng)的HPC模擬和深度學(xué)習(xí)中都是至關(guān)重要的部分。”

該公司表示,在Nvidia 推出Ampere之后,Selene的建造和投入運營不到一個月。

Nvidia還在其他三臺計算機(jī)上運行內(nèi)部工作負(fù)載,這些計算機(jī)使其躋身Top500排名。有基于V100的DGX Superpod機(jī)器,它在最新的Top500上以9.4 Linpack petaflops排名第24;基于P100的DGX Saturn-V,于2016年部署,目前以3.3 petaflops排名第78位;Circe,另一個基于V100的Superpod,它以3.1 Linpack petaflops占據(jù)了第91梯級。

Moor Insights and Strategy的HPC和深度學(xué)習(xí)高級分析師Karl Freund提出了評論, 強調(diào)了這種內(nèi)部超級計算能力對Nvidia競爭地位的整合作用。他對HPCwire表示: “首先是在土星5號,現(xiàn)在是在Selene,現(xiàn)在Nvidia正在使用他們自己的技術(shù)來創(chuàng)建更好的產(chǎn)品,硬件和軟件,這將為某些人創(chuàng)建具有競爭力的產(chǎn)品 打下堅實的基礎(chǔ)。” “您無法想象一家初創(chuàng)公司要花費數(shù)千萬美元來開發(fā)超級計算機(jī),工程師們可以用它來開發(fā)他們的下一個芯片。使用AI,尤其是深度學(xué)習(xí)和強化學(xué)習(xí)網(wǎng)絡(luò)來進(jìn)行后端物理設(shè)計,已顯示出了巨大的創(chuàng)新。”

Nvidia的最新AI超級計算機(jī)Selene在Green500名單上排名第二,提供了20.52吉瓦/瓦的功率,成為僅有的兩臺突破20吉瓦/瓦的障礙的機(jī)器之一。排名最高的綠色機(jī)器是MN-3,由Top500新人Preferred Networks制造。MN-3的每瓦運行記錄達(dá)到了創(chuàng)紀(jì)錄的21.1 gigaflops,Linpack得分為1.62 petaflops,在Top500中排名第394。

Nvidia GPU為Top500上十個最節(jié)能的機(jī)器中的六個提供動力,在前20個中的十五個中為15個提供動力。

Nvidia還通過使用新的PCIe A100 GPU卡來擴(kuò)展其Ampere產(chǎn)品組合。當(dāng)Nvidia 推出 其Ampere架構(gòu)時,獲得A100 GPU的唯一方法是購買Nvidia的DGX A100系統(tǒng)(可提供四GPU和八GPU配置)或HGX A100構(gòu)建塊,并由合作的云服務(wù)提供商和服務(wù)器制造商加以利用?,F(xiàn)在,數(shù)據(jù)中心公司宣布服務(wù)器合作伙伴將推出基于PCIe的系統(tǒng),其配置范圍從一個GPU到十個或更多GPU。

英偉達(dá)表示,具有NVLink的SXM變體仍僅作為HGX平臺的一部分提供,它具有NVLink連接性,可提供PCIe Gen4帶寬的10倍。

Nvidia出售了SXM尺寸和PCIe尺寸的上一代V100 GPU。SXM不僅限于出售HGX板,這使系統(tǒng)制造商能夠從根本上構(gòu)建自己的DGX克隆,這有可能削弱Nvidia的銷售額?,F(xiàn)在,英偉達(dá)正在加強其銷售策略,以便希望基于性能更高,配備NVLink的SXM部件提供服務(wù)器的OEM合作伙伴必須使用英偉達(dá)的四路或八路HGX板構(gòu)建基于A100的解決方案。

“這是按渠道劃分的模型;直接渠道客戶可以并且將購買DGX,其他所有人都通過OEM購買。” Freund說。“這是一個非常干凈的模型。OEM注意到他們必須迅速采取行動,否則Nvidia將作為系統(tǒng)供應(yīng)商來承擔(dān)所有這些責(zé)任,對嗎?但是Nvidia并不是真的想要擁有一個足夠廣泛的銷售渠道來專門實現(xiàn)這一目標(biāo)。因此,他們?nèi)匀恍枰狾EM。”

PCIe外形在峰值性能上與SXM相匹配:9.7 teraflops FP64性能(高達(dá)19.5 teraflops FP64張量核心性能)和19.6 teraflops FP32性能(高達(dá)312 teraflops張量浮點32 [啟用結(jié)構(gòu)稀疏性])。但是,與SXM的400瓦相比,其功耗為250瓦,PCIe A100旨在以較低的TDP運行。這意味著盡管最高性能相同,但持續(xù)性能會受到影響。Nvidia表示,在實際應(yīng)用中,當(dāng)在單個GPU上運行時,A100 PCIe GPU可以提供A100 SXM交付性能的90%左右。但據(jù)Nvidia稱,當(dāng)擴(kuò)大應(yīng)用程序在四個,八個或更多GPU上運行的位置時,由于NVLink連接,HGX內(nèi)的SXM配置可將性能提高多達(dá)50%。

英偉達(dá)表示,PCIe配置非常適合主流加速服務(wù)器,這些服務(wù)器已進(jìn)入標(biāo)準(zhǔn)機(jī)架,每臺服務(wù)器的功耗更低。“雖然PCIe用于AI推理和某些可跨一個或兩個GPU擴(kuò)展的HPC應(yīng)用程序,但A100 SXM配置對于應(yīng)用程序可擴(kuò)展到服務(wù)器以及服務(wù)器中多個GPU的客戶來說是理想的選擇,” Paresh Kharya說, Nvidia加速計算產(chǎn)品管理總監(jiān)。

隨著Nvidia加快其A100的上市速度,該公司期待著由A100驅(qū)動的服務(wù)器的擴(kuò)展生態(tài)系統(tǒng)。預(yù)計今年夏天將有30個系統(tǒng),到今年年底將有20多個系統(tǒng)。預(yù)計將有眾多系統(tǒng)制造商推出這些系統(tǒng),包括華碩,Atos,思科,戴爾技術(shù),富士通,技嘉科技,惠普企業(yè),浪潮,聯(lián)想,一站式系統(tǒng),Quanta / QCT和Supermicro。Nvidia還報告說,它正在建立其經(jīng)過NGC就緒 認(rèn)證的系統(tǒng)產(chǎn)品組合 。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!