橘子百科-橘子都知道橘子百科-橘子都知道

正、异、新,正异新的区分

正、异、新,正异新的区分 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮(cháo)”最大赢家之(zhī)一、英伟达(dá)背后的(de)那个(gè)身穿黑色(sè)皮(pí)衣的(de)男人又(yòu)来了。

  前脚才交出亮眼业绩狂(kuáng)拉股价,英伟(wěi)达CEO黄仁(rén)勋(xūn)后脚就在昨日(rì)的COMPUTEX大会上宣布,“我们(men)已到达生成式(shì)AI引爆(bào)点。从此,全(quán)世(shì)界的每个(gè)角落,都会有计算需求。”

  如今(jīn)英伟达掌握着全球多家科(kē)技(jì)公司“算力命脉”,而在这场(chǎng)大(dà)会(huì)上,黄仁(rén)勋激情(qíng)演(yǎn)讲2个小(xiǎo)时(shí),甩出了多项重(zhòng)磅新(xīn)发布,包括(kuò)算力“杀器”DGX GH200超级计算机、针对游(yóu)戏的ACE代工服务、MGX服务器规范等内容。

  算力“杀器”:DGX GH200超级计算机正、异、新,正异新的区分+GH200超级芯(xīn)片

  先看“集(jí)成了英伟达最先进加速(sù)计算和网络技术”的(de)DGX GH200人工(gōng)智能超级计算机

  这(zhè)款超算专为大规模生成(chéng)式AI的(de)负(fù)载所设计,由256块GH200超级芯片组成,拥有1 exaflop超凡AI性能(néng)、144TB内存(是英(yīng)伟(wěi)达目前DGX A100系统的近500倍)、150英里光(guāng)纤、2000多(duō)个风扇。

  DGX GH200重达40000磅(约(yuē)合18143千克),堪(kān)比四只(zhǐ)成年大象的(de)体重。

  预计DGX GH200将于今年(nián)年底投入问世(shì),英伟达暂未公布价格,而谷歌云(yún)、Meta与微软(ruǎn)将是首批(pī)用(yòng)户

  同时,英伟达也正(zhèng)在打造自家基于DGX GH200的(de)大型(xíng)AI超(chāo)级计算机NVIDIA Helios,以支持(chí)其研究和开发(fā)团(tuán)队的工作。其中采用4个DGX GH200系统、1024颗Grace Hopper超级芯片,每个(gè)都(dōu)将与(yǔ)英伟达Quantum-2 InfiniBand网络连接,带宽高达400Gb/s,将于(yú)今年年底上线。

  值得一提的(de)是,黄仁勋透露,DGX GH200集成的GH200 Grace Hopper超级芯片已进(jìn)入全面生(shēng)产(chǎn)

  “拉踩”CPU:成本、功耗、处(chù)理数据量不如GPU

  在本(běn)次大会上,黄仁勋还(hái)“拉踩”了一波CPU。他(tā)从功(gōng)耗、处理数据量(liàng)等方面,指出使(shǐ)用GPU胜过CPU。

  举例来(lái)说,花费1000万美元(yuán),可以建(jiàn)设(shè)一个有960颗CPU的(de)数据中心,其可处理(lǐ)1X LMM(大语(yǔ)言模(mó)型(xíng))数(shù)据量,需要11GWh功耗;

  同(tóng)样成本下,也可以(yǐ)建(jiàn)设一个有48个GPU的(de)数(shù)据中心(xīn),其可(kě)处(chù)理44X LLM数据量,仅(jǐn)需要3.2GWh功(gōng)耗(hào)。

  若只想处理1X LMM数据量,则(zé)只需40万美元,便可拥有一个(gè)搭(dā)载2个(gè)GPU、功耗(hào)仅0.13GWh的数(shù)据中心。

  “买越(yuè)多,省(shěng)越多(The more you buy, the more you save)。”黄(huáng)仁勋再(zài)次表(biǎo)示。

  同时,他也列出了(le)数据中(zhōng)心成本公式:数(shù)据中心总(zǒng)持有成本=f[成本(芯片(piàn)、系统(tǒng)、硬件(jiàn)正、异、新,正异新的区分生态系统(tǒng))、吞吐量(GPU、Algo软件(jiàn)、网络、系统软件、软(ruǎn)件生态(tài)系(xì)统)、使用率(Algo Lib, 软件生态系统(tǒng))、采(cǎi)购(gòu)运营、生(shēng)命周期最佳(jiā)化(huà)、电力]

  ACE代工(gōng)服务:用(yòng)AI激(jī)活NPC生命

  游戏(xì)一直是(shì)备受关注的一大AI应用落(luò)地领域。英伟达也在大会(huì)上宣布,推(tuī)出面向游(yóu)戏的定(dìng)制(zhì)AI模型代工服务(wù)NVIDIA Avatar Cloud Engine(ACE)

  它能赋予非玩家(jiā)角(jiǎo)色(NPC)更(gèng)智能且不断进化的对话技(jì)能(néng),中间(jiān)件(jiàn)、工(gōng)具和(hé)游戏开发者可使用它来构(gòu)建和(hé)部署定制的语音(yīn)、对话(huà)和动(dòng)画AI模型

  其中包括:英伟达NeMo,使用专有(yǒu)数据构建(jiàn)、定制和部署语言模型;英伟达Riva,用(yòng)于(yú)自动语音识别(bié)和文本转语音(yīn)实现实(shí)时语音(yīn)对话(huà);英伟达Omniverse Audio2Face,用(yòng)于即时创建游戏角色表情动画,以匹配任(rèn)何语音轨道。

  开(kāi)发人员可选择集成整个NVIDIA ACE for Games解决(jué)方案,也(yě)可(kě)仅使用需要的(de)组件(jiàn)。

  新参(cān)考工(gōng)作(zuò)流(liú)程:帮助建设数(shù)字化(huà)智能(néng)工厂

  黄仁勋表示,全球电子制造(zào)商正在使用一种(zhǒng)全新的综合参(cān)考工作流程推进工(gōng)业数字化工作,该(gāi)工作流程结(jié)合(hé)了(le)英伟达用于生成(chéng)式AI、3D协作、仿真和自主机器的技术(shù),包(bāo)括:

  英伟达(dá)Omniverse,其(qí)连接了顶级计算(suàn)机(jī)辅助设计应用(yòng)以及生成(chéng)式AI的API和(hé)前沿(yán)框(kuāng)架(jià);用于模拟和测试机器人的英伟达Isaac Sim应用程序(xù);英伟达Metropolis视觉AI框架,用于(yú)自动(dòng)光学检测。

  同时,黄(huáng)仁勋现场展示了一个完全数字化的智(zhì)能工厂的演(yǎn)示。

  目(mù)前富(fù)士康(kāng)工业互联(lián)网、宜鼎(dǐng)国际、和硕、广(guǎng)达和纬创(chuàng)正(zhèng)在使(shǐ)用这一参考工作(zuò)流程(chéng),具体用例包括电路板质保检测点自动化、光学检测自动化、建(jiàn)设虚拟工厂、模拟协作机器人、构建(jiàn)及运(yùn)营数(shù)字孪(luán)生等。

  MGX服务器规范:快速高效构建百余种服务器配置(zhì)

  英伟达发布NVIDIA MGX服务器规范,为系统制造商提供模块化参考架构,满足各种规模的数据中(zhōng)心需求。系统制(zhì)造商可(kě)使用它快速且经济(jì)高效地构(gòu)建100多种服务(wù)器(qì)配置,以适应广泛的(de)AI、HPC及NVIDIA Omniverse应用。

  MGX支(zhī)持英伟达全系(xì)列GPU、CPU、DPU和(hé)网络适(shì)配器、各种x86、完整软件堆栈(zhàn)及Arm处理器(qì),还可集成到云和企业数据中心(xīn)中(zhōng)。

  华硕、和硕、QCT、超微(Supermicro)等都将采用MGX构建下一代加速(sù)计算机(jī),可(kě)将开发成本削减多达(dá)3/4,并(bìng)将开(kāi)发(fā)时(shí)间缩短2/3至仅(jǐn)需6个月(yuè)

  其中,QCT和超微基于(yú)MGX的设计将于8月面(miàn)世。超微昨日公布的(de)ARS-221GL-NR系统将采用Grace CPU,而(ér)QCT的S74G-2U系(xì)统将(jiāng)采用Grace Hopper。

  推出Spectrum-X网(wǎng)络平(píng)台 构建(jiàn)超(chāo)大(dà)规模生成式AI超(chāo)级计算(suàn)机Israel-1

  另外,黄仁(rén)勋宣布推出NVIDIA Spectrum-X网络平台,旨在(zài)提(tí)高基于以(yǐ)太网的AI云的性能和(hé)效率。

  相比传统(tǒng)以(yǐ)太网(wǎng)结构,Spectrum-X可实现1.7倍(bèi)的整体AI性能(néng)和能效提(tí)升,并具有高度(dù)通用性,可(kě)用(yòng)于各种AI应用。它使用完全(quán)基(jī)于标准的以太网,并可(kě)与基于以太网的堆(duī)栈互(hù)操作。该平(píng)台支持256个(gè)200Gb/s端口(kǒu),通过单个交换机连接,或(huò)在两层(céng)leaf-spine拓扑中提供16000个端口,以支(zhī)持(chí)AI云增长和扩展(zhǎn),在保持性能的(de)同时最大限度减少网络延迟(chí)。

  全(quán)球(qiú)领先云计算(suàn)提供商正在采用Spectrum-X平台扩展生成式AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已在(zài)戴尔、联想等系统制造(zào)商处提供。

  此外,作为Spectrum-X参考(kǎo)设计的(de)蓝图和(hé)测试平台,英(yīng)伟达(dá)正构建(jiàn)一台(tái)超(chāo)大(dà)规(guī)模生(shēng)成式AI超(chāo)级计算(suàn)机Israel-1。这台(tái)AI超(chāo)算(suàn)价值数(shù)亿美元(yuán),将采用戴(dài)尔PowerEdge XE9680服务器、英伟达HGX H100超级计算平台、内置(zhì)BlueField-3 DPU和Spectrum-4交换机的Spectrum-X平台。

  结语

  “40年来,我们创(chuàng)造了PC、互联网、移动、云,现在(zài)是人工智能时代。你会创造什(shén)么?不管是什(shén)么,都(dōu)要(yào)像我们一样追赶它。要奔(bēn)跑,不要走。要么为(wèi)了食物奔跑,要么作为食物奔跑。”

  在5月(yuè)27日的(de)台湾大学(xué)发表了毕业典礼演讲(jiǎng)上(shàng),黄仁(rén)勋再(zài)次强调了(le)掌握(wò)AI技术(shù)的重要(yào)性:很多人担心(xīn),AI会(huì)抢走自己(jǐ)的工作。但真正会(huì)抢走你饭碗的,是(shì)掌握了(le)AI技术的人。

  他表示,从各方面(miàn)来看(kàn),AI的(de)兴盛(shèng)是计算机产业的再生契机。在下个十年,我们的产(chǎn)业将使(shǐ)用新型(xíng)AI电脑,取(qǔ)代价值万亿美(měi)元的传统电脑。

  而从昨日大(dà)会上(shàng)黄仁勋的展示中,人工智能(néng)时代的(de)未(wèi)来(lái)轮廓似乎已(yǐ)逐渐浮现。

未经允许不得转载:橘子百科-橘子都知道 正、异、新,正异新的区分

评论

5+2=