欧美一区二区午夜精品_伊人久久精品视频一区二区_狠狠色丁香婷婷久久综合

英偉達(dá)今天與世界上最快的計算機(jī)的最新列表同時發(fā)布了其Selene AI超級計算機(jī)。Nvidia還介紹了基于Ampere的A100 GPU的PCIe尺寸。

Nvidia的新型內(nèi)部AI超級計算機(jī)Selene加入了第55位Top500的行列，打破了能源效率壁壘。Selene憑借27.5雙精度Linpack petaflops，在ISC 2020數(shù)字會議的今天公布的最新Top500榜單上排名第七。Selene是榜單上性能最高的第二大行業(yè)系統(tǒng)，僅次于Eni的 HPC5計算機(jī)，后者以35.5 HPL petaflops(還使用Nvidia GPU)排名第六。

該Top500列表標(biāo)志著兩個行業(yè)系統(tǒng)進(jìn)入前十名，而Selene是第一個這樣做的內(nèi)部IT供應(yīng)商系統(tǒng)。英偉達(dá)內(nèi)部使用超級計算機(jī)來支持芯片設(shè)計和模型開發(fā)，以及在機(jī)器人技術(shù)，自動駕駛汽車，醫(yī)療保健和其他研究項目中的工作。

Selene是位于加利福尼亞州圣克拉拉的DGX SuperPOD，它由DGX A100尺寸內(nèi)的Nvidia的A100 GPU和AMD的Epyc Rome CPU驅(qū)動，并通過Mellanox HDR InfiniBand集群。Selene總共包含280臺DGX A100，總共容納2,240個A100 GPU和494臺Mellanox Quantum 200G InfiniBand交換機(jī)，提供56 TB / s的網(wǎng)絡(luò)結(jié)構(gòu)。該系統(tǒng)包括7 PB的全閃存網(wǎng)絡(luò)存儲。

營銷高級副總裁吉拉德·謝納(Gilad Shainer)說，Selene是使用SHARP通過網(wǎng)絡(luò)和GPU的垂直集成構(gòu)建的，他是通過收購Mellanox來到英偉達(dá)的。他在為媒體舉行的簡短預(yù)告中說：“ SHARP是網(wǎng)絡(luò)上進(jìn)行數(shù)據(jù)縮減的引擎，這在傳統(tǒng)的HPC模擬和深度學(xué)習(xí)中都是至關(guān)重要的部分。”

該公司表示，在Nvidia 推出Ampere之后，Selene的建造和投入運營不到一個月。

Nvidia還在其他三臺計算機(jī)上運行內(nèi)部工作負(fù)載，這些計算機(jī)使其躋身Top500排名。有基于V100的DGX Superpod機(jī)器，它在最新的Top500上以9.4 Linpack petaflops排名第24;基于P100的DGX Saturn-V，于2016年部署，目前以3.3 petaflops排名第78位;Circe，另一個基于V100的Superpod，它以3.1 Linpack petaflops占據(jù)了第91梯級。

Moor Insights and Strategy的HPC和深度學(xué)習(xí)高級分析師Karl Freund提出了評論，強調(diào)了這種內(nèi)部超級計算能力對Nvidia競爭地位的整合作用。他對HPCwire表示： “首先是在土星5號，現(xiàn)在是在Selene，現(xiàn)在Nvidia正在使用他們自己的技術(shù)來創(chuàng)建更好的產(chǎn)品，硬件和軟件，這將為某些人創(chuàng)建具有競爭力的產(chǎn)品打下堅實的基礎(chǔ)。” “您無法想象一家初創(chuàng)公司要花費數(shù)千萬美元來開發(fā)超級計算機(jī)，工程師們可以用它來開發(fā)他們的下一個芯片。使用AI，尤其是深度學(xué)習(xí)和強化學(xué)習(xí)網(wǎng)絡(luò)來進(jìn)行后端物理設(shè)計，已顯示出了巨大的創(chuàng)新。”

Nvidia的最新AI超級計算機(jī)Selene在Green500名單上排名第二，提供了20.52吉瓦/瓦的功率，成為僅有的兩臺突破20吉瓦/瓦的障礙的機(jī)器之一。排名最高的綠色機(jī)器是MN-3，由Top500新人Preferred Networks制造。MN-3的每瓦運行記錄達(dá)到了創(chuàng)紀(jì)錄的21.1 gigaflops，Linpack得分為1.62 petaflops，在Top500中排名第394。

Nvidia GPU為Top500上十個最節(jié)能的機(jī)器中的六個提供動力，在前20個中的十五個中為15個提供動力。

Nvidia還通過使用新的PCIe A100 GPU卡來擴(kuò)展其Ampere產(chǎn)品組合。當(dāng)Nvidia 推出其Ampere架構(gòu)時，獲得A100 GPU的唯一方法是購買Nvidia的DGX A100系統(tǒng)(可提供四GPU和八GPU配置)或HGX A100構(gòu)建塊，并由合作的云服務(wù)提供商和服務(wù)器制造商加以利用?，F(xiàn)在，數(shù)據(jù)中心公司宣布服務(wù)器合作伙伴將推出基于PCIe的系統(tǒng)，其配置范圍從一個GPU到十個或更多GPU。

英偉達(dá)表示，具有NVLink的SXM變體仍僅作為HGX平臺的一部分提供，它具有NVLink連接性，可提供PCIe Gen4帶寬的10倍。

Nvidia出售了SXM尺寸和PCIe尺寸的上一代V100 GPU。SXM不僅限于出售HGX板，這使系統(tǒng)制造商能夠從根本上構(gòu)建自己的DGX克隆，這有可能削弱Nvidia的銷售額?，F(xiàn)在，英偉達(dá)正在加強其銷售策略，以便希望基于性能更高，配備NVLink的SXM部件提供服務(wù)器的OEM合作伙伴必須使用英偉達(dá)的四路或八路HGX板構(gòu)建基于A100的解決方案。

“這是按渠道劃分的模型;直接渠道客戶可以并且將購買DGX，其他所有人都通過OEM購買。” Freund說。“這是一個非常干凈的模型。OEM注意到他們必須迅速采取行動，否則Nvidia將作為系統(tǒng)供應(yīng)商來承擔(dān)所有這些責(zé)任，對嗎?但是Nvidia并不是真的想要擁有一個足夠廣泛的銷售渠道來專門實現(xiàn)這一目標(biāo)。因此，他們?nèi)匀恍枰狾EM。”

PCIe外形在峰值性能上與SXM相匹配：9.7 teraflops FP64性能(高達(dá)19.5 teraflops FP64張量核心性能)和19.6 teraflops FP32性能(高達(dá)312 teraflops張量浮點32 [啟用結(jié)構(gòu)稀疏性])。但是，與SXM的400瓦相比，其功耗為250瓦，PCIe A100旨在以較低的TDP運行。這意味著盡管最高性能相同，但持續(xù)性能會受到影響。Nvidia表示，在實際應(yīng)用中，當(dāng)在單個GPU上運行時，A100 PCIe GPU可以提供A100 SXM交付性能的90%左右。但據(jù)Nvidia稱，當(dāng)擴(kuò)大應(yīng)用程序在四個，八個或更多GPU上運行的位置時，由于NVLink連接，HGX內(nèi)的SXM配置可將性能提高多達(dá)50%。

英偉達(dá)表示，PCIe配置非常適合主流加速服務(wù)器，這些服務(wù)器已進(jìn)入標(biāo)準(zhǔn)機(jī)架，每臺服務(wù)器的功耗更低。“雖然PCIe用于AI推理和某些可跨一個或兩個GPU擴(kuò)展的HPC應(yīng)用程序，但A100 SXM配置對于應(yīng)用程序可擴(kuò)展到服務(wù)器以及服務(wù)器中多個GPU的客戶來說是理想的選擇，” Paresh Kharya說， Nvidia加速計算產(chǎn)品管理總監(jiān)。

隨著Nvidia加快其A100的上市速度，該公司期待著由A100驅(qū)動的服務(wù)器的擴(kuò)展生態(tài)系統(tǒng)。預(yù)計今年夏天將有30個系統(tǒng)，到今年年底將有20多個系統(tǒng)。預(yù)計將有眾多系統(tǒng)制造商推出這些系統(tǒng)，包括華碩，Atos，思科，戴爾技術(shù)，富士通，技嘉科技，惠普企業(yè)，浪潮，聯(lián)想，一站式系統(tǒng)，Quanta / QCT和Supermicro。Nvidia還報告說，它正在建立其經(jīng)過NGC就緒認(rèn)證的系統(tǒng)產(chǎn)品組合。