顶的速度越来越快越叫的原因-橘子百科-橘子都知道

顶的速度越来越快越叫的原因 “AI春晚”英伟达放大招：亮算力“杀器”、助游戏“捏人”；黄仁勋帮算账：GPU多买多省

　　“AI热(rè)潮”最(zuì)大赢家(jiā)之一、英伟达背后(hòu)的那(nà)个(gè)身穿黑色皮衣的(de)男人又来(lái)了。

　　前脚才交出亮眼业(yè)绩狂(kuáng)拉股价，英伟(wěi)达CEO黄(huáng)仁勋(xūn)后脚就在昨日的COMPUTEX大会(huì)上宣布，“我们已到达生成式AI引爆(bào)点(diǎn)。从此，全(quán)世界的每(měi)个角落(luò)，都会有计算(suàn)需求。”

　　如今(jīn)英伟达掌握(wò)着全球多家科技公司“算力命脉”，而在(zài)这场大会上，黄仁勋(xūn)激情演讲(jiǎng)2个小时(shí)，甩出了多项重磅新发布，包括算力“杀器”DGX GH200超级计算机、针对游戏的ACE代工服务、MGX服(fú)务器规范等内容。

　　算力“杀器”：DGX GH200超级计算机+GH200超级(jí)芯(xīn)片(piàn)

　　先看(kàn)“集成(chéng)了英伟达(dá)最先进(jìn)加速(sù)计(jì)算和网络技术(shù)”的DGX GH200人工(gōng)智能超级计算机。

　　这款超算专为大规(guī)模生(shēng)成(chéng)式AI的负载所(suǒ)设计(jì)，由(yóu)256块GH200超级(jí)芯(xīn)片组(zǔ)成，拥有(yǒu)1 exaflop超凡(fán)AI性能、144TB内存（是英伟达目前(qián)DGX A100系统的近500倍）、150英(yīng)里光纤(xiān)、2000多个风扇。

　　DGX GH200重达40000磅（约合18143千克），堪比(bǐ)四(sì)只(zhǐ)成年大象的体重。

　　预计(jì)DGX GH200将于今年(nián)年底投入(rù)问世，英伟(wěi)达暂未(wèi)公布价(jià)格，而谷歌(gē)云、Meta与微软(ruǎn)将(jiāng)是首(shǒu)批用户。

　　同时，英伟达也正在打造自家(jiā)基(jī)于DGX GH200的大型AI超级计算机(jī)NVIDIA Helios，以支持其研究和开发团(tuán)队的(de)工作。其中采用4个(gè)DGX GH200系统(tǒng)、1024颗Grace Hopper超级芯(xīn)片，每个(gè)都将与英伟达Quantum-2 InfiniBand网络连接(jiē)，带宽高达(dá)400Gb/s，将于(yú)今年(nián)年底上线。

　　值得(dé)一提(tí)的是，黄仁勋透(tòu)露，DGX GH200集成的GH200 Grace Hopper超(chāo)级(jí)芯(xīn)片已进入全面生产。

　　“拉踩”CPU：成本、功(gōng)耗、处理数(shù)据量(liàng)不如GPU

　　在(zài)本次大会上，黄仁勋还“拉踩”了一波CPU。他从功耗、处理数据量等方面，指出使用GPU胜过CPU。

　　举例来(lái)说，花费1000万(wàn)美元，可以建设一个有960颗CPU的数据(jù)中心，其可处理1X LMM（大语言模型）数据量(liàng)，需要11GWh功(gōng)耗；

　　同(tóng)样成本下，也可以(yǐ)建设一个有48个GPU的数据中心，其可处理44X LLM数据量，仅需要3.2GWh功耗。

　　若只想处理(lǐ)1X LMM数(shù)据(jù)量，则只需40万美元，便可拥有一个搭载2个GPU、功耗仅0.13GWh的数据中心(xīn)。

　　“买越多，省越多(duō)（The more you buy， the more you save）。”黄仁勋再次表(biǎo)示(shì)。

　　同时，他也列出了数据中心成(chéng)本公式(shì)：数据中(zhōng)心总(zǒng)持有成本=f[成本（芯片、系统、硬件生(shēng)态系统）、吞(tūn)吐量（GPU、Algo软件、网络(luò)、系统软件、软件生态(tài)系(xì)统）、使用率(lǜ)（Algo Lib，软件生(shēng)态系统）、采购运营、生命周期(qī)最佳化、电(diàn)力]。

　　ACE代(dài)工服(fú)务：用AI激(jī)活(huó)NPC生命

　　游戏(xì)一直是备受(shòu)关注的一大AI应(yīng)用(yòng)落地领域。英(yīng)伟达(dá)也在大会上宣布，推(tuī)出面向游戏的定制AI模型代工服务(wù)NVIDIA Avatar Cloud Engine（ACE）顶的速度越来越快越叫的原因ong>。

　　它能赋(fù)予非玩家角色(sè)（NPC）更智(zhì)能(néng)且不断进(jìn)化的对话技(jì)能(néng)，中间件、工具和游戏开发者(zhě)可使用它来(lái)构建和部署定制(zhì)的语音、对话和动画(huà)AI模型顶的速度越来越快越叫的原因>。

　　其(qí)中包括：英伟达NeMo，使用专有数据构建、定制和(hé)部署语言模型(xíng)；英伟(wěi)达Riva，用(yòng)于自(zì)动语(yǔ)音(yīn)识(shí)别和(hé)文(wén)本转语(yǔ)音实现实(shí)时语音对话；英伟达(dá)Omniverse Audio2Face，用(yòng)于即时(shí)创建游戏(xì)角色表情动画，以(yǐ)匹配任何语(yǔ)音(yīn)轨道。

　　开发人员可选择集成整个NVIDIA ACE for Games解(jiě)决方案，也可仅使用需要的组(zǔ)件。

　　新参考工作流程：帮助建(jiàn)设数(shù)字化智能工(gōng)厂

　　黄仁勋表(biǎo)示，全球电子制(zhì)造商(shāng)正(zhèng)在使用一(yī)种全新的综合参(cān)考(kǎo)工(gōng)作(zuò)流(liú)程推(tuī)进工业数字(zì)化工作，该工作(zuò)流程结合了英伟达用于生成式(shì)AI、3D协作、仿真和自主机器(qì)的(de)技(jì)术，包括：

　　英(yīng)伟(wěi)达Omniverse，其连接了顶级计算机辅助设(shè)计应用以及生成(chéng)式AI的API和前沿框架(jià)；用于(yú)模拟和测(cè)试(shì)机器(qì)人的英伟达Isaac Sim应用程序；英伟(wěi)达Metropolis视觉(jué)AI框架，用于自动(dòng)光(guāng)学检测(cè)。

　　同时，黄仁勋(xūn)现场展示(shì)了一个完全数(shù)字(zì)化的智(zhì)能工厂的演示(shì)。

　　目前富士康工业互(hù)联网、宜(yí)鼎(dǐng)国际、和硕、广达(dá)和纬(wěi)创正(zhèng)在使用这一参考(kǎo)工作流程，具体用例包(bāo)括(kuò)电路板质(zhì)保检测(cè)点自动化、光(guāng)学检测自动(dòng)化、建(jiàn)设虚拟工厂、模拟协作机器人、构建及(jí)运营(yíng)数字孪生等。

　　MGX服务器(qì)规范：快(kuài)速高(gāo)效(xiào)构建百余(yú)种服(fú)务(wù)器(qì)配置

　　英伟(wěi)达发布NVIDIA MGX服务器规(guī)范，为系统制造商提供模块化参考(kǎo)架构，满足(zú)各种(zhǒng)规模的数据中心需求。系(xì)统制造商可使用(yòng)它快(kuài)速且经济(jì)高效地构建100多种服务器(qì)配置，以适应广泛的AI、HPC及NVIDIA Omniverse应(yīng)用。

　　MGX支(zhī)持英伟达全系列GPU、CPU、DPU和网络(luò)适(shì)配器(qì)、各种x86、完(wán)整(zhěng)软(ruǎn)件(jiàn)堆栈及Arm处理器，还可集成(chéng)到云和(hé)企业数据中心中。

　　华硕(shuò)、和硕(shuò)、QCT、超微(wēi)（Supermicro）等都将(jiāng)采用MGX构建(jiàn)下一代加速(sù)计算机，可将开(kāi)发成(chéng)本削减多(duō)达(dá)3/4，并将开发(fā)时间缩短2/3至仅(jǐn)需(xū)6个月。

　　其中，QCT和超微基于(yú)MGX的(de)设(shè)计将于(yú)8月(yuè)面世。超微昨日公布的ARS-221GL-NR系统(tǒng)将(jiāng)采(cǎi)用(yòng)Grace CPU，而QCT的(de)S74G-2U系(xì)统将采用Grace Hopper。

　　推出Spectrum-X网(wǎng)络(luò)平台构建超大规模(mó)生成式AI超级计算机(jī)Israel-1

　　另外，黄仁勋宣布推出(chū)NVIDIA Spectrum-X网(wǎng)络(luò)平(píng)台，旨(zhǐ)在(zài)提高基于以(yǐ)太(tài)网的AI云的性能和效率。

　　相比传统以太网(wǎng)结构，Spectrum-X可实现1.7倍的整体(tǐ)AI性能和能(néng)效(xiào)提升(shēng)，并具(jù)有(yǒu)高度通用性，可(kě)用(yòng)于各种(zhǒng)AI应用。它使用完全基于标准的以太网(wǎng)，并可(kě)与基于以太网的堆(duī)栈互(hù)操(cāo)作。该(gāi)平台支持256个200Gb/s端口，通(tōng)过单个交换机连接，或在两层leaf-spine拓扑中提(tí)供(gōng)16000个(gè)端口，以支持AI云增(zēng)长(zhǎng)和(hé)扩展，在(zài)保(bǎo)持性能的同时最(zuì)大限度减少(shǎo)网(wǎng)络延迟(chí)。

　　全球领先云计算提(tí)供商正在采用Spectrum-X平(píng)台扩展生成式AI服务，而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已(yǐ)在(zài)戴尔、联(lián)想等系统制造商处提供。

　　此(cǐ)外，作(zuò)为Spectrum-X参考设计的蓝图和测试平(píng)台，英伟达(dá)正构建一台超大规模生成式AI超级计算机(jī)Israel-1。这台AI超(chāo)算价值数亿(yì)美元，将采用戴尔PowerEdge XE9680服务(wù)器、英伟达HGX H100超(chāo)级(jí)计算平(píng)台、内置(zhì)BlueField-3 DPU和(hé)Spectrum-4交换机(jī)的Spectrum-X平台。

　　结语

　　“40年来(lái)，我们创造了PC、互联(lián)网(wǎng)、移动、云(yún)，现(xiàn)在是(shì)人工智能时(shí)代。你会创造(zào)什么？不管(guǎn)是(shì)什么，都要像我们一样追赶它。要奔跑，不要走。要(yào)么为了(le)食(shí)物奔(bēn)跑，要么(me)作(zuò)为食物(wù)奔跑(pǎo)。”

　　在5月27日(rì)的台湾大学发表了(le)毕业典(diǎn)礼演讲上(shàng)，黄仁勋(xūn)再次(cì)强调了掌握AI技(jì)术(shù)的重要性：很多(duō)人担心，AI会抢走(zǒu)自己的工作。但真正会抢走你饭碗(wǎn)的，是(shì)掌(zhǎng)握了AI技术的(de)人。

　　他(tā)表示，从各方面(miàn)来(lái)看，AI的兴盛是计算机产业的(de)再生契机。在下个十(shí)年，我们的产(chǎn)业将(jiāng)使用新(xīn)型(xíng)AI电脑，取代价值(zhí)万亿美(měi)元的传统电脑(nǎo)。顶的速度越来越快越叫的原因>

　　而从昨(zuó)日大会上黄仁勋的展示中，人工智能时代的未来轮廓似乎已逐渐(jiàn)浮现。

未经允许不得转载：橘子百科-橘子都知道顶的速度越来越快越叫的原因