橘子百科-橘子都知道橘子百科-橘子都知道

顶的速度越来越快越叫的原因

顶的速度越来越快越叫的原因 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热(rè)潮”最(zuì)大赢家(jiā)之一、英伟达背后(hòu)的那(nà)个(gè)身穿黑色皮衣的(de)男人又来(lái)了。

  前脚才交出亮眼业(yè)绩狂(kuáng)拉股价,英伟(wěi)达CEO黄(huáng)仁勋(xūn)后脚就在昨日的COMPUTEX大会(huì)上宣布,“我们已到达生成式AI引爆(bào)点(diǎn)。从此,全(quán)世界的每(měi)个角落(luò),都会有计算(suàn)需求。”

  如今(jīn)英伟达掌握(wò)着全球多家科技公司“算力命脉”,而在(zài)这场大会上,黄仁勋(xūn)激情演讲(jiǎng)2个小时(shí),甩出了多项重磅新发布,包括算力“杀器”DGX GH200超级计算机、针对游戏的ACE代工服务、MGX服(fú)务器规范等内容。

  算力“杀器”:DGX GH200超级计算机+GH200超级(jí)芯(xīn)片(piàn)

  先看(kàn)“集成(chéng)了英伟达(dá)最先进(jìn)加速(sù)计(jì)算和网络技术(shù)”的DGX GH200人工(gōng)智能超级计算机

  这款超算专为大规(guī)模生(shēng)成(chéng)式AI的负载所(suǒ)设计(jì),由(yóu)256块GH200超级(jí)芯(xīn)片组(zǔ)成,拥有(yǒu)1 exaflop超凡(fán)AI性能、144TB内存(是英伟达目前(qián)DGX A100系统的近500倍)、150英(yīng)里光纤(xiān)、2000多个风扇。

  DGX GH200重达40000磅(约合18143千克),堪比(bǐ)四(sì)只(zhǐ)成年大象的体重。

  预计(jì)DGX GH200将于今年(nián)年底投入(rù)问世,英伟(wěi)达暂未(wèi)公布价(jià)格,而谷歌(gē)云、Meta与微软(ruǎn)将(jiāng)是首(shǒu)批用户

  同时,英伟达也正在打造自家(jiā)基(jī)于DGX GH200的大型AI超级计算机(jī)NVIDIA Helios,以支持其研究和开发团(tuán)队的(de)工作。其中采用4个(gè)DGX GH200系统(tǒng)、1024颗Grace Hopper超级芯(xīn)片,每个(gè)都将与英伟达Quantum-2 InfiniBand网络连接(jiē),带宽高达(dá)400Gb/s,将于(yú)今年(nián)年底上线。

  值得(dé)一提(tí)的是,黄仁勋透(tòu)露,DGX GH200集成的GH200 Grace Hopper超(chāo)级(jí)芯(xīn)片已进入全面生产

  “拉踩”CPU:成本、功(gōng)耗、处理数(shù)据量(liàng)不如GPU

  在(zài)本次大会上,黄仁勋还“拉踩”了一波CPU。他从功耗、处理数据量等方面,指出使用GPU胜过CPU。

  举例来(lái)说,花费1000万(wàn)美元,可以建设一个有960颗CPU的数据(jù)中心,其可处理1X LMM(大语言模型)数据量(liàng),需要11GWh功(gōng)耗;

  同(tóng)样成本下,也可以(yǐ)建设一个有48个GPU的数据中心,其可处理44X LLM数据量,仅需要3.2GWh功耗。

  若只想处理(lǐ)1X LMM数(shù)据(jù)量,则只需40万美元,便可拥有一个搭载2个GPU、功耗仅0.13GWh的数据中心(xīn)。

  “买越多,省越多(duō)(The more you buy, the more you save)。”黄仁勋再次表(biǎo)示(shì)。

  同时,他也列出了数据中心成(chéng)本公式(shì):数据中(zhōng)心总(zǒng)持有成本=f[成本(芯片、系统、硬件生(shēng)态系统)、吞(tūn)吐量(GPU、Algo软件、网络(luò)、系统软件、软件生态(tài)系(xì)统)、使用率(lǜ)(Algo Lib, 软件生(shēng)态系统)、采购运营、生命周期(qī)最佳化、电(diàn)力]

  ACE代(dài)工服(fú)务:用AI激(jī)活(huó)NPC生命

  游戏(xì)一直是备受(shòu)关注的一大AI应(yīng)用(yòng)落地领域。英(yīng)伟达(dá)也在大会上宣布,推(tuī)出面向游戏的定制AI模型代工服务(wù)NVIDIA Avatar Cloud Engine(ACE)顶的速度越来越快越叫的原因ong>。

  它能赋(fù)予非玩家角色(sè)(NPC)更智(zhì)能(néng)且不断进(jìn)化的对话技(jì)能(néng),中间件、工具和游戏开发者(zhě)可使用它来(lái)构建和部署定制(zhì)的语音、对话和动画(huà)AI模型顶的速度越来越快越叫的原因>。

  其(qí)中包括:英伟达NeMo,使用专有数据构建、定制和(hé)部署语言模型(xíng);英伟(wěi)达Riva,用(yòng)于自(zì)动语(yǔ)音(yīn)识(shí)别和(hé)文(wén)本转语(yǔ)音实现实(shí)时语音对话;英伟达(dá)Omniverse Audio2Face,用(yòng)于即时(shí)创建游戏(xì)角色表情动画,以(yǐ)匹配任何语(yǔ)音(yīn)轨道。

  开发人员可选择集成整个NVIDIA ACE for Games解(jiě)决方案,也可仅使用需要的组(zǔ)件。

  新参考工作流程:帮助建(jiàn)设数(shù)字化智能工(gōng)厂

  黄仁勋表(biǎo)示,全球电子制(zhì)造商(shāng)正(zhèng)在使用一(yī)种全新的综合参(cān)考(kǎo)工(gōng)作(zuò)流(liú)程推(tuī)进工业数字(zì)化工作,该工作(zuò)流程结合了英伟达用于生成式(shì)AI、3D协作、仿真和自主机器(qì)的(de)技(jì)术,包括:

  英(yīng)伟(wěi)达Omniverse,其连接了顶级计算机辅助设(shè)计应用以及生成(chéng)式AI的API和前沿框架(jià);用于(yú)模拟和测(cè)试(shì)机器(qì)人的英伟达Isaac Sim应用程序;英伟(wěi)达Metropolis视觉(jué)AI框架,用于自动(dòng)光(guāng)学检测(cè)。

  同时,黄仁勋(xūn)现场展示(shì)了一个完全数(shù)字(zì)化的智(zhì)能工厂的演示(shì)。

  目前富士康工业互(hù)联网、宜(yí)鼎(dǐng)国际、和硕、广达(dá)和纬(wěi)创正(zhèng)在使用这一参考(kǎo)工作流程,具体用例包(bāo)括(kuò)电路板质(zhì)保检测(cè)点自动化、光(guāng)学检测自动(dòng)化、建(jiàn)设虚拟工厂、模拟协作机器人、构建及(jí)运营(yíng)数字孪生等。

  MGX服务器(qì)规范:快(kuài)速高(gāo)效(xiào)构建百余(yú)种服(fú)务(wù)器(qì)配置

  英伟(wěi)达发布NVIDIA MGX服务器规(guī)范,为系统制造商提供模块化参考(kǎo)架构,满足(zú)各种(zhǒng)规模的数据中心需求。系(xì)统制造商可使用(yòng)它快(kuài)速且经济(jì)高效地构建100多种服务器(qì)配置,以适应广泛的AI、HPC及NVIDIA Omniverse应(yīng)用。

  MGX支(zhī)持英伟达全系列GPU、CPU、DPU和网络(luò)适(shì)配器(qì)、各种x86、完(wán)整(zhěng)软(ruǎn)件(jiàn)堆栈及Arm处理器,还可集成(chéng)到云和(hé)企业数据中心中。

  华硕(shuò)、和硕(shuò)、QCT、超微(wēi)(Supermicro)等都将(jiāng)采用MGX构建(jiàn)下一代加速(sù)计算机,可将开(kāi)发成(chéng)本削减多(duō)达(dá)3/4,并将开发(fā)时间缩短2/3至仅(jǐn)需(xū)6个月

  其中,QCT和超微基于(yú)MGX的(de)设(shè)计将于(yú)8月(yuè)面世。超微昨日公布的ARS-221GL-NR系统(tǒng)将(jiāng)采(cǎi)用(yòng)Grace CPU,而QCT的(de)S74G-2U系(xì)统将采用Grace Hopper。

  推出Spectrum-X网(wǎng)络(luò)平台 构建超大规模(mó)生成式AI超级计算机(jī)Israel-1

  另外,黄仁勋宣布推出(chū)NVIDIA Spectrum-X网(wǎng)络(luò)平(píng)台,旨(zhǐ)在(zài)提高基于以(yǐ)太(tài)网的AI云的性能和效率。

  相比传统以太网(wǎng)结构,Spectrum-X可实现1.7倍的整体(tǐ)AI性能和能(néng)效(xiào)提升(shēng),并具(jù)有(yǒu)高度通用性,可(kě)用(yòng)于各种(zhǒng)AI应用。它使用完全基于标准的以太网(wǎng),并可(kě)与基于以太网的堆(duī)栈互(hù)操(cāo)作。该(gāi)平台支持256个200Gb/s端口,通(tōng)过单个交换机连接,或在两层leaf-spine拓扑中提(tí)供(gōng)16000个(gè)端口,以支持AI云增(zēng)长(zhǎng)和(hé)扩展,在(zài)保(bǎo)持性能的同时最(zuì)大限度减少(shǎo)网(wǎng)络延迟(chí)。

  全球领先云计算提(tí)供商正在采用Spectrum-X平(píng)台扩展生成式AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已(yǐ)在(zài)戴尔、联(lián)想等系统制造商处提供。

  此(cǐ)外,作(zuò)为Spectrum-X参考设计的蓝图和测试平(píng)台,英伟达(dá)正构建一台超大规模生成式AI超级计算机(jī)Israel-1。这台AI超(chāo)算价值数亿(yì)美元,将采用戴尔PowerEdge XE9680服务(wù)器、英伟达HGX H100超(chāo)级(jí)计算平(píng)台、内置(zhì)BlueField-3 DPU和(hé)Spectrum-4交换机(jī)的Spectrum-X平台。

  结语

  “40年来(lái),我们创造了PC、互联(lián)网(wǎng)、移动、云(yún),现(xiàn)在是(shì)人工智能时(shí)代。你会创造(zào)什么?不管(guǎn)是(shì)什么,都要像我们一样追赶它。要奔跑,不要走。要(yào)么为了(le)食(shí)物奔(bēn)跑,要么(me)作(zuò)为食物(wù)奔跑(pǎo)。”

  在5月27日(rì)的台湾大学发表了(le)毕业典(diǎn)礼演讲上(shàng),黄仁勋(xūn)再次(cì)强调了掌握AI技(jì)术(shù)的重要性:很多(duō)人担心,AI会抢走(zǒu)自己的工作。但真正会抢走你饭碗(wǎn)的,是(shì)掌(zhǎng)握了AI技术的(de)人。

  他(tā)表示,从各方面(miàn)来(lái)看,AI的兴盛是计算机产业的(de)再生契机。在下个十(shí)年,我们的产(chǎn)业将(jiāng)使用新(xīn)型(xíng)AI电脑,取代价值(zhí)万亿美(měi)元的传统电脑(nǎo)。顶的速度越来越快越叫的原因>

  而从昨(zuó)日大会上黄仁勋的展示中,人工智能时代的未来轮廓似乎已逐渐(jiàn)浮现。

未经允许不得转载:橘子百科-橘子都知道 顶的速度越来越快越叫的原因

评论

5+2=