周一,英偉達(NVDA.US)首席執(zhí)行官黃仁勛在2023年臺北電腦展上公布了一批與人工智能(AI)和加速計算有關的多項產(chǎn)品及服務的進展。以下為具體信息。
1、大內(nèi)存AI超級計算機DGX GH200
(相關資料圖)
黃仁勛介紹稱,AI超級計算機DGX GH200集成了英偉達最先進的加速計算和網(wǎng)絡技術,旨在為生成式AI語言應用、推薦系統(tǒng)、數(shù)據(jù)分析工作負載開發(fā)大型下一代模型,預計今年年底問世。
黃仁勛表示,DGX GH200是首款將GH200 Grace Hopper超級芯片與英偉達NVLink Switch系統(tǒng)搭配的超級計算機,通過采用新互連方式,將256個Grace Hopper超級芯片連接在一起,使它們能像單個巨型GPU一樣協(xié)同運行,從而提供了1EFLOPS的性能和144TB的共享內(nèi)存,較2020年推出的上一代DGX A100 320GB系統(tǒng)的內(nèi)存多出近500倍。
黃仁勛稱,谷歌(GOOG.US)、Meta(META.US)、微軟(MSFT.US)等科技巨頭是首批獲得DGX GH200訪問權限、用于生成式AI工作負載的公司。此外,英偉達還打算將DGX GH200設計藍圖提供給云服務商及其他超大規(guī)模計算廠商,以便他們可以進一步為其基礎設施定制DGX GH200。
2、GH200 Grace Hopper超級芯片已全面投產(chǎn)
黃仁勛指出,英偉達的GH200 Grace Hopper超級芯片已全面投產(chǎn),將為運行復雜的AI和高性能計算工作負載提供動力。基于GH200的系統(tǒng)加入了全球系統(tǒng)制造商基于英偉達最新Grace、Hopper、Ada Lovelace架構的400多個系統(tǒng)配置。位于歐美的幾家全球超大規(guī)模計算企業(yè)和超算中心客戶將可使用GH200驅動的系統(tǒng)。采用GH200的系統(tǒng)預計將于今年晚些時候上市。
3、大型AI超級計算機NVIDIA Helios
黃仁勛表示,英偉達正在打造自己的基于DGX GH200的大型AI超級計算機NVIDIA Helios,以支持其研究和開發(fā)團隊的工作。Helios采用4個DGX GH200系統(tǒng),每個都將與英偉達Quantum-2 InfiniBand網(wǎng)絡連接,帶寬高達400Gb/s,以提高訓練大型AI模型的數(shù)據(jù)吞吐量。Helios將包括1024顆Grace Hopper超級芯片,將于今年年底上線。
4、NVIDIA Avatar云引擎(ACE)
黃仁勛宣布,推出面向游戲的NVIDIA Avatar云引擎(ACE)。這是一項定制AI模型代工服務,中間件、工具和游戲開發(fā)者可以使用它來構建和部署定制的語音、對話和動畫AI模型。它能賦予非玩家角色(NPC)更智能且不斷進化的對話技能,使其能夠以栩栩如生的個性來回答玩家的問題。
5、NVIDIA MGX服務器規(guī)范
為了滿足各種規(guī)模的數(shù)據(jù)中心的需求,黃仁勛發(fā)布了NVIDIA MGX服務器規(guī)范,為系統(tǒng)制造商提供了模塊化參考架構。系統(tǒng)制造商可使用它快速且經(jīng)濟高效地構建100多種服務器配置,以適應廣泛的AI、HPC及NVIDIA Omniverse應用。MGX支持英偉達全系列GPU、CPU、DPU和網(wǎng)絡適配器,以及各種x86及Arm處理器。其模塊化設計使系統(tǒng)制造商能夠更有效地滿足每個客戶的獨特預算、電力輸送、熱設計和機械要求。
永擎(ASRock Rack)、華碩(ASUS)、技嘉(GIGABYTE)、和碩(Pegatron)、QCT、超微(Supermicro)等將采用MGX構建下一代加速計算機,可將開發(fā)成本削減多達3/4,并將開發(fā)時間縮短2/3至僅需6個月。
6、與軟銀合作建立分布式數(shù)據(jù)中心網(wǎng)絡
黃仁勛還宣布,英偉達與日本電信巨頭軟銀合作,在日本建立一個分布式數(shù)據(jù)中心網(wǎng)絡。它將在一個共同的云平臺上提供5G服務和生成式AI應用。數(shù)據(jù)中心將在模塊化MGX系統(tǒng)中使用Grace Hopper、BlueField-3 DPU以及Spectrum以太網(wǎng)交換機,以提供5G協(xié)議所需的高精度定時。該平臺將通過提高頻譜效率來降低成本,同時降低能耗。這些系統(tǒng)有助于探索自動駕駛、AI工廠、AR/VR、計算機視覺和數(shù)字孿生等領域的應用。未來的用途可能包括3D視頻會議和全息通信。
7、聯(lián)手WPP打造生成式AI內(nèi)容引擎
黃仁勛宣布,全球最大的營銷服務機構英國WPP集團正在與英偉達合作,在Omniverse Cloud上構建首個生成式AI內(nèi)容引擎,使創(chuàng)意團隊能夠更快、更高效、更大規(guī)模地制作高質量的商業(yè)內(nèi)容,同時與客戶的品牌保持完全一致。基于NVIDIA AI和Omniverse的突破性引擎將來自領先軟件制造商的創(chuàng)意3D和AI工具連接在一起,以大規(guī)模革新品牌內(nèi)容和體驗。
WPP首席執(zhí)行官Mark Read表示,生成式AI正以驚人的速度改變營銷世界,WPP與英偉達合作所提供的獨特競爭優(yōu)勢是當今市場上其他客戶無法獲得的,這項新技術將改變品牌為商業(yè)用途創(chuàng)建內(nèi)容的方式,并鞏固WPP在為世界頂級品牌創(chuàng)造性應用AI方面的行業(yè)領導者地位。
8、新型加速以太網(wǎng)平臺NVIDIA Spectrum-X
黃仁勛還宣布推出NVIDIA Spectrum-X,這是一個旨在提高基于以太網(wǎng)的AI云的性能和效率的網(wǎng)絡平臺。它基于網(wǎng)絡創(chuàng)新,將英偉達Spectrum-4以太網(wǎng)交換機與英偉達BlueField-3 DPU緊密耦合,實現(xiàn)了相比傳統(tǒng)以太網(wǎng)結構1.7倍的整體AI性能和能效提升,并通過性能隔離增強了多租戶功能,在多租戶環(huán)境中保持一致、可預測的性能。
全球領先的云計算提供商正在采用Spectrum-X平臺擴展生成式AI服務。Spectrum-X、Spectrum-4交換機、BlueField-3 DPU等現(xiàn)已在戴爾、聯(lián)想、超微等系統(tǒng)制造商處提供。