腾众软件科技有限公司腾众软件科技有限公司

手握日月摘星辰,世间无我这般人,李白的诗一剑霜寒十四州

手握日月摘星辰,世间无我这般人,李白的诗一剑霜寒十四州 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热(rè)潮”最(zuì)大赢家之一、英伟达背后的那个身穿黑色(sè)皮衣的男人又来了。

  前脚才交出亮眼(yǎn)业绩狂(kuáng)拉股价,英伟达CEO黄仁勋后(hòu)脚就在昨日的COMPUTEX大会上宣布,“我们已到(dào)达生成式AI引爆点。从此,全世界的每个角落,都会有(yǒu)计算需求。”

  如今英(yīng)伟达掌握着全球多家科技(jì)公司(sī)“算力命脉(mài)”,而在这场(chǎng)大会上,黄仁勋(xūn)激(jī)情演讲(jiǎng)2个小(xiǎo)时,甩出(chū)了多项重磅(bàng)新发布,包括算力(lì)“杀器(qì)”DGX GH200超级(jí)计算(suàn)机、针对游戏的ACE代工服务、MGX服务器规范等内(nèi)容。

  算力“杀(shā)器(qì)”:DGX GH200超级计算机+GH200超级芯片

  先看“集成了英伟(wěi)达最先进加速计(jì)算和网络技(jì)术”的DGX GH200人工(gōng)智能超级计算机

  这款(kuǎn)超算专(zhuān)为大(dà)规模生成式AI的负载(zài)所设计,由(yóu)256块GH200超级芯(xīn)片组(zǔ)成,拥(yōng)有1 exaflop超凡AI性能、144TB内存(是英伟达(dá)目前(qián)DGX A100系统的近500倍)、150英里光纤、2000多个风扇。

  DGX GH200重达40000磅(约合18143千克),堪比四只(zhǐ)成年大象的体重。

  预计DGX GH200将于(yú)今(jīn)年年底投入问(wèn)世,英伟达暂未公布价格,而谷歌(gē)云(yún)、Meta与微(wēi)软(ruǎn)将是首批用户

  同(tóng)时,英伟达也正在打(dǎ)造自家基于DGX GH200的大型AI超级计(jì)算机NVIDIA Helios,以(yǐ)支(zhī)持其研(yán)究和开发团(tuán)队(duì)的工作。其中采用4个DGX GH200系(xì)统、1024颗Grace Hopper超级(jí)芯(xīn)片(piàn),每个都将与英伟达Quantum-2 InfiniBand网络连接,带宽高(gāo)达(dá)400Gb/s,将(jiāng)于今年年底上线。

  值得(dé)一提的是,黄仁勋透(tòu)露(lù),DGX GH200集成的GH200 Grace Hopper超级芯(xīn)片已进(jìn)入全面生(shēng)产(chǎn)

  “拉踩”CPU:成(chéng)本、功耗(hào)、处理数(shù)据量不如GPU

  在本次(cì)大会上,黄(huáng)仁勋还“拉踩”了(le)一波CPU。他(tā)从功(gōng)耗、处理数据量等方面(miàn),指(zhǐ)出使(shǐ)用(yòng)GPU胜过CPU。

  举例来说(shuō),花(huā)费1000万美元,可(kě)以(yǐ)建(jiàn)设(shè)一个有(yǒu)960颗(kē)CPU的数据中心,其可处(chù)理1X LMM(大语言模型(xíng))数(shù)据量,需要11GWh功耗;

  同样成(chéng)本下,也可以建设一(yī)个有48个GPU的数据中心(xīn),其可处(chù)理44X LLM数(shù)据量(liàng),仅需要3.2GWh功耗。

  若只想处理1X LMM数据量,则只需(xū)40万美元(yuán),便可拥有一(yī)个(gè)搭载(zài)2个GPU、功耗仅0.13GWh的数据中心(xīn)。

  “买(mǎi)越多,省越(yuè)多(The more you buy, the more you save)。”黄仁(rén)勋再次表示。

  同时,他也列出了数(shù)据中(zhōng)心成本公式:数据(jù)中心(xīn)总(zǒng)持(chí)有成本(běn)=f[成本(芯片、系统、硬件生态系(xì)统(tǒng))、吞吐量(GPU、Algo软件、网络(luò)、系(xì)统(tǒng)软件、软(ruǎn)件生态(tài)系统)、使用率(Algo Lib, 软件生态(tài)系统)、采购运营、生命周期(qī)最(zuì)佳(jiā)化、电力]

  ACE代(dài)工服务(wù):用AI激活(huó)NPC生(shēng)命

  游(yóu)戏一直是备受关注的一大AI应用(yòng)落地(dì)领域。英(yīng)伟达也(yě)在大会上宣布,推出面向游戏的(de)定(dìng)制AI模型代工服务NVIDIA Avatar Cloud Engine(ACE)

  它能赋(fù)予非玩(wán)家角色(sè)(NPC)更智(zhì)能且(qiě)不断进(jìn)化的(de)对话(huà)技能(néng),中(zhōng)间(jiān)件(jiàn)、工具和游戏(xì)开发(fā)者可使用它来构建和(hé)部(bù)署定制(zhì)的语音、对话和动画AI模型

  其中包(bāo)括(kuò):英伟达NeMo,使(shǐ)用专有(yǒu)数据构建(jiàn)、定制和部署语言模型;英(yīng)伟达(dá)Riva,用于自动语音识别和文本转语音实现(xiàn)实时语音对话;英伟达(dá)Omniverse Audio2Face,用于即时(shí)创建游戏角色表情(qíng)动画,以匹(pǐ)配任何语音轨道。

  开发人员可(kě)选择(zé)集(jí)成整个NVIDIA ACE for Games解决方案,也(yě)可仅使用需要的组(zǔ)件。

  新参(cān)考(kǎo)工(gōng)作流程(chéng):帮助建(jiàn)设(shè)数(shù)字化智(zhì)能工(gōng)厂

  黄仁勋表(biǎo)示,全球电(diàn)子制(zhì)造商正在(zài)使(shǐ)用一种全新的(de)综合(hé)参考(kǎo)工作流(liú)程推进工业数字化工(gōng)作,该工作流程结合了英伟达(dá)用于生成式(shì)AI、3D协作(zuò)、仿(fǎng)真(zhēn)和(hé)自(zì)主机器的技术(shù),包括:

  英伟达Omniverse,其(qí)连接(jiē)了顶级计(jì)算(suàn)机辅助设计应用以及生成式AI的API和前沿框(kuāng)架;用于模拟和测试机器人的英伟(wěi)达Isaac Sim应用程序;英(yīng)伟达Metropolis视觉AI框架(jià),用于自动光学检(jiǎn)测。

  同(tóng)时,黄仁勋现场展(zhǎn)示了一个完(wán)全数字化的智能工厂的演示。

  目前富士康工业互联网(wǎng)、宜鼎国际、和硕、广达和(hé)纬创正在使(shǐ)用这(zhè)一参考(kǎo)工(gōng)作流(liú)程,具体用例(lì)包括(kuò)电路(lù)板质(zhì)保检测点(diǎn)自动(dòng)化、光学(xué)检(jiǎn)测自动化(huà)、建设虚拟工厂、模拟协作机(jī)器人、构建及(jí)运营数字孪生等。

  MGX服务器规范(fàn):快速高效构建百余种服务器配置

  英(yīng)伟达发布NVIDIA MGX服务器(qì)规范,为系(xì)统(tǒng)制(zhì)造商提供模块化参考架(jià)构,满(mǎn)足各(gè)种规模(mó)的数据中心需求。系统制(zhì)造(zào)商(shāng)可使(shǐ)用它快(kuài)速且(qiě)经济高效(xiào)地构建100多种服务器配(pèi)置,以适应广泛的AI、HPC及(jí)NVIDIA Omniverse应(yīng)用。

  MGX支持英(yīng)伟达全系(xì)列GPU、CPU、DPU和网络(luò)适配(pèi)器、各种x86、完整软件堆(duī)栈及Arm处(chù)理器,还可集成到云(yún)和(hé)企业数据中心(xīn)中(zhōng)。

  华硕、和硕(shuò)、QCT、超微(Supermicro)等(děng)都将采(cǎi)用MGX构建下一代加速计算(suàn)机,可(kě)将开发成本削减多(duō)达3/4,并将开发时间缩短2/3至仅(jǐn)需6个(gè)月

  其(qí)中,QCT和超微基于(yú)MGX的设计将(jiāng)于8月面世(shì)。超微昨日公布的ARS-221GL-NR系(xì)统将采(cǎi)用Grace CPU,而QCT的S74G-2U系统将(jiāng)采用Grace Hopper。

  手握日月摘星辰,世间无我这般人,李白的诗一剑霜寒十四州rong>推出(chū)Spectrum-X网络平台 构建超大规(guī)模生成式AI超级计算机Israel-1

  另外,黄仁勋宣布推出NVIDIA Spectrum-X网络平(píng)台(tái),旨在(zài)提(tí)高基于以太(tài)网的AI云的性能和(hé)效率(lǜ)。

  相比传统(tǒng)以太(tài)网结构,Spectrum-X可实现1.7倍的整体(tǐ)AI性能和能效提升(shēng),并具有高度通用性,可用于各种AI应用。它(tā)使用完(wán)全基于标准的(de)以太网,并可(kě)与基于以太网的(de)堆栈互操(cāo)作手握日月摘星辰,世间无我这般人,李白的诗一剑霜寒十四州。该平台支持256个(gè)200Gb/s端口,通过单个交换机连接,或在两层leaf-spine拓扑中提(tí)供16000个端口,以支持AI云增长和扩展,在保持(chí)性能的同(tóng)时(shí)最(zuì)大限度减少网(wǎng)络延迟。

  全球(qiú)领先云计算(suàn)提(tí)供(gōng)商(shāng)正(zhèng)在采用Spectrum-X平台扩(kuò)展生成式AI服务,而Spectrum-X、Spectrum-4交换机(jī)、BlueField-3 DPU等已在戴尔、联想等系(xì)统(tǒng)制造(zào)商处提供。

  此外(wài),作为Spectrum-X参考设计的蓝图和测试平(píng)台,英伟达正构建一台超(chāo)大(dà)规模生成式AI超级计算机(jī)Israel-1。这台AI超算(suàn)价值数亿(yì)美元(yuán),将(jiāng)采用戴尔PowerEdge XE9680服务(wù)器、英伟达HGX H100超级计算平台、内置BlueField-3 DPU和Spectrum-4交换机(jī)的Spectrum-X平台。

  结(jié)语

  “40年来(lái),我(wǒ)们(men)创造(zào)了PC、互联(lián)网、移动、云,现在是人(rén)工智能时代。你会创造什(shén)么?不管是什么,都要像(xiàng)我们一样(yàng)追赶它(tā)。要奔跑,不要走。要么为了食(shí)物(wù)奔(bēn)跑,要(yào)么作为食物奔跑(pǎo)。”

  在5月27日的台湾大学(xué)发(fā)表(biǎo)了毕业典礼演讲上(shàng),黄仁勋再(zài)次强调了掌握AI技术的重要性:很(hěn)多人担心,AI会(huì)抢走自(zì)己的工(gōng)作。但真正(zhèng)会抢(qiǎng)走你饭碗的,是(shì)掌(zhǎng)握了AI技术(shù)的人(rén)。

  他表示,从各方面(miàn)来看,AI的兴盛是计(jì)算机产业(yè)的再生契机。在下(xià)个十年,我们的(de)产业将使用新型AI电脑(nǎo),取代(dài)价值万亿美元的(de)传统电脑。

  而从(cóng)昨日大会(huì)上黄仁勋的展示中(zhōng),人工(gōng)智能时(shí)代的未(wèi)来轮廓(kuò)似乎(hū)已逐渐浮现。

未经允许不得转载:腾众软件科技有限公司 手握日月摘星辰,世间无我这般人,李白的诗一剑霜寒十四州

评论

5+2=