黄仁勋上午在在台北流行音乐中心做了Computex 2025的首场主题演讲,关注度自然也是极高的。两个小时的演讲,不仅回顾了英伟达公司30年的发展历程,还详细阐述了英伟达在AI、加速计算、机器人和企业级AI基础设施等领域的思考和突破。
全场听下来,我觉得有几个重点:
1、"AI现已成为基础设施"。黄仁勋过去一两年,在发言中一直强调将AI基础设施与电力和互联网相提并论,认为这是继这两次革命后的第三次基础设施革命。而这一框架暗示着英伟达也不再仅将自己定位为技术供应商,而是将自己视为智能基础设施的关键参与者,类似于早期GE和西门子在电力革命中扮演的角色。
2、"AI工厂"构想引领数据中心转型
与智能基础设施紧密相关的,则是认为传统数据中心已经过时,取而代之的是"AI工厂"—应用能源生产高价值"tokens"的设施。英伟达正努力将数据中心从IT成本中心重新定义为价值创造中心,这对数据中心产业链和相关资本支出具有深远影响,也是一个万亿美元的市场。
3、强调平台战略,开放生态系统
长期以来,NVLink作为英伟达专有的高速互连技术,一直是其AI系统性能优势的关键差异化因素。但是今后,英伟达会通过NVLink Fusion,将这一技术通过芯片组和IP授权的形式向第三方开放,使客户和合作伙伴能够构建混合架构的AI系统,同时保持与英伟达生态系统的兼容性。
黄仁勋也在演讲中强调,"你的AI基础设施可以有一些英伟达的产品,很多你自己的产品;可以有很多CPU,很多ASIC,也许还有很多英伟达GPU。无论如何,你都能受益于使用NVLink基础设施和生态系统。"
从技术角度看,NVLink Fusion通过两种方式实现互操作性:一是提供NVLink芯片组,可以与第三方加速器直接相连;二是提供IP,集成到合作伙伴的ASIC设计中。这使得ASIC设计公司能够创建与英伟达系统无缝集成的专用AI加速器,而CPU厂商则能开发支持NVLink C2C(芯片到芯片)接口的处理器,直接连接到英伟达的Blackwell和下一代Rubin芯片。
4、推动AI算力普惠
DGX Spark和新DGX Station两个系统的推出,反映了黄仁勋对AI计算普惠的愿景。通过提供从服务器到桌面的一致架构,英伟达正尝试重现个人电脑革命的模式—将过去只有大型机构才能负担的计算能力带给个人开发者和小型组织,从而扩大创新机会和市场规模。
5、DeepSeek是一个世界AI的礼物
当然,继GTC2025上用DeepSeek R1做演示之后,黄仁勋再次表达了对DeepSeek的认可:"DeepSeek R1确实是世界AI行业的礼物。计算机科学突破的数量真的相当可观,为美国和世界各地的研究人员开辟了大量优秀的研究。无论我去哪里,DeepSeek R1都对人们如何思考AI,如何思考推理和推理AI产生了实质性影响。他们为行业和世界做出了巨大贡献。"
还有一个事关本地的新闻发布,就是英伟达打算在台北的北投士林科技园区(北士科)建设海外总部了。更多内容,大家可以往下看演讲的重点实录。
一、英伟达的进化:从芯片公司到AI基础设施提供者
黄仁勋开场便表示,英伟达已经连续30年参与中国台湾地区科技生态系统的建设,并概述了本次演讲将涵盖的内容:行业现状与未来发展、新产品发布以及与合作伙伴共同发展生态系统的计划。
在回顾英伟达历史时,黄仁勋强调公司历经了多次重大转型,这也反映了整个计算机产业的革命性变革。"英伟达的故事是计算机产业的重塑,同时也是我们公司的重塑,"他说道。英伟达始于1993年,最初仅作为一家芯片公司,目标是创建新的计算平台。2006年,公司推出了CUDA,这一技术彻底改变了计算方式。十年后的2016年,英伟达意识到一种新的计算方式已经到来,需要重塑整个技术栈的每一层:处理器、软件栈和系统架构都需要创新。
这一认知促使英伟达开发出DGX-1系统。黄仁勋回忆道:"在2016年GTC大会上,当我宣布DGX-1时,没有人理解我在说什么,也没有人下订单。我将第一台DGX-1捐赠给了一家名为OpenAI的非营利组织,它开启了AI革命。"
随着人工智能技术的发展,英伟达逐渐认识到AI应用与传统软件运行方式的本质区别。传统应用在大型数据中心的少数处理器上运行(称为超大规模),而新型AI应用需要多个处理器协同工作,为数百万用户提供服务。这种新型数据中心的架构也因此发生根本性变化,需要两种网络:一种用于南北向通信(控制存储、控制平面和外部连接),另一种更为关键的是东西向网络,即计算机之间相互通信以解决问题。
基于这一认识,英伟达在2019年收购了高性能计算和大规模分布式处理领域的领先网络公司Mellanox。黄仁勋解释道:"我们将整个数据中心转变为一个计算单元。现代计算机是整个数据中心,数据中心是计算的单位。不再只是PC或服务器,整个数据中心正在运行一项工作。"
随着英伟达的数据中心业务发展,公司认识到自身角色的转变。黄仁勋强调:"历史上没有任何公司,尤其是技术公司,会提前五年公布路线图。但我们意识到英伟达不再仅仅是一家技术公司,我们现在是一家基础设施公司,是全球必不可少的基础设施提供者。"
他比喻这种转变类似于历史上的其他基础设施革命:"就像第一次工业革命时,GE、西屋和西门子意识到电力是一种新技术,需要在全球建设新的基础设施。几十年后,我们意识到信息也是一种新型基础设施,虽然最初难以理解,但现在我们知道那就是互联网。现在,我们面临第三种新型基础设施——智能基础设施。现在说智能基础设施可能没有意义,但我保证,十年后回顾时,你会意识到AI已经融入了一切。"
黄仁勋指出,这种智能基础设施需要"工厂"——AI工厂,它们与传统数据中心截然不同。"这些AI数据中心实际上是AI工厂。你投入能源,它产出极其有价值的东西,称为'tokens'(令牌)。企业已经开始谈论上季度或上月生产了多少tokens,很快我们会讨论每小时产出多少tokens,就像每个工厂一样。"
通过这一演变,英伟达的商业机会从1993年估计的3亿美元芯片产业,扩展到现在价值数万亿美元的AI基础设施行业。黄仁勋总结道:"这就是我们正在开拓的令人兴奋的未来。"
二、英伟达技术基石:CUDA与库的关键作用
黄仁勋强调,英伟达所做的一切都建立在几项核心技术之上:加速计算、人工智能以及CUDA X库。他特别指出:"我们一直在谈论库,实际上,我们是世界上唯一一家不断谈论库的技术公司。这是因为库是我们所做一切的核心,是一切的起点。"
在谈到英伟达的技术实力时,黄仁勋首先展示了GeForce RTX 5060的实时光线追踪演示。他解释了其背后的AI技术:"你看到的每个像素都经过光线追踪。我们如何能够模拟光子并以这种分辨率提供这种帧率?原因是人工智能。我们实际上只渲染十分之一的像素,其他九个像素由AI猜测,而且猜得非常完美。这项技术叫做DLSS,神经渲染,我们花了很多年开发。自从开始研究AI以来,这已经是十年的旅程。AI彻底革新了计算机图形学。GeForce将AI带给了世界,现在AI回馈并革新了GeForce。"
黄仁勋接着详细介绍了英伟达的库生态系统,这是公司技术战略的核心。他解释了为什么加速计算与通用计算有根本区别:"如果你可以像通用计算那样写软件、编译软件然后在CPU上运行,那就叫做CPU了。事实上我们需要做一些不同的事情。这是因为有这么多人致力于通用计算,投入了数万亿美元的创新。突然间芯片中的几个小部件让计算机速度提高50倍、100倍,这怎么可能?"
他解释了英伟达的逻辑:"如果你更了解应用程序,你就能加速它。如果你创建一个更适合以光速运行的架构,即使只针对5%的代码,也能加速99%的运行时间。大多数应用程序中,代码的一小部分消耗了大部分运行时间。我们基于这一观察结果,一个领域接一个领域地进行优化。"
黄仁勋展示了英伟达的库生态系统,包括:
cuBLAS用于数值计算
Aerial和Sionna用于5G和6G无线电信号处理
Parabricks用于基因组分析
Monai用于医学影像
Earth 2用于天气预测
cuQuantum用于量子经典计算机架构
cuTensorNet和cuTensor用于张量数学
Megatron、cuDNN以及最新的Dynamo操作系统用于深度学习
cuDF用于数据框架
cuML用于经典机器学习
Warp作为描述CUDA内核的Python框架
cuOpt用于优化问题(如旅行商问题、供应链优化)
cuDSS和cuSparse用于稀疏结构模拟器
cuLitho用于计算光刻,可将掩模制作过程的计算加速50-70倍
黄仁勋特别强调了库如何帮助英伟达开拓特定市场和地区。例如,在电信领域,英伟达花了六年时间优化完全加速的无线接入网络(RAN)堆栈,现在其性能与最先进的ASIC相当。他提到了公司在这一领域的重要合作伙伴,包括软银、T-Mobile、Indosat、沃达丰、诺基亚、三星、京瓷、富士通和思科。
在量子计算方面,黄仁勋表示英伟达正在开发量子经典或量子GPU计算平台,称为Q2Q,并与全球众多公司合作。他预测:"未来,所有超级计算机都将配备量子加速器。超级计算机将是一个QPU,配有QPUs、GPUs和一些CPUs。这将是现代计算机的代表。"
三、AI的进化路径:从感知到物理AI的全景图
黄仁勋详细阐述了AI的进化历程,描绘出一幅从感知AI到物理AI的全景图。他将这一进化分为几个关键阶段:
"十二年前,我们从感知开始——能够理解模式、识别语音和图像的AI模型。过去五年,我们一直在讨论生成式AI——AI不仅能理解,还能生成内容。它可以从文本到文本(如ChatGPT),文本到图像,文本到视频,视频到文本,图像到文本,几乎是任何内容到任何内容。这就是AI的神奇之处——我们发现了一个通用函数近似器,一个通用翻译器,只要我们能将信息标记化,它就能从任何内容翻译成任何其他内容。"
黄仁勋接着解释了AI进化的下一阶段——推理AI。"生成式AI给了我们一次性AI,你给出文本,它返回文本。两年前,当我们首次接触ChatGPT时,这是一个重大突破。你给出文本,它返回文本,预测下一个词,预测下一个段落。但智能远不止于从大量数据中学习,智能包括推理能力——解决以前从未见过的问题,逐步分解问题,应用规则和定理,模拟多种选择并权衡利弊。"
他提到了几项相关技术:"思维链(Chain of thought),将问题逐步分解;思维树(Tree of thought),探索多条路径。所有这些技术都使AI能够推理。一旦AI具备推理能力,并具备感知能力(例如多模态读取PDF、搜索、使用工具),我们就有了代理AI(agentic AI)。"
黄仁勋解释道,代理AI的工作方式类似于人类:"我们被给予一个目标,我们逐步分解它,推理应该做什么,最好的方法是什么,考虑后果,然后开始执行计划。计划可能包括做一些研究,使用一些工具,甚至与另一个AI代理合作。代理AI基本上是理解、思考和行动。而这正是机器人循环。代理AI基本上是数字形式的机器人。"
接下来,黄仁勋展望了未来的物理AI(physical AI):"AI理解现实世界,理解惯性、摩擦、因果关系等概念。例如,如果我滚动一个球,它滑到汽车下面,根据球的速度,它可能会滑到汽车的另一侧,球并没有消失——这叫做物体持久性(object permanence)。你可以推理出,如果面前有一张桌子,要到另一边去,最好的方法不是直接穿过去,而是绕过去或从下面过去。能够推理这些物理事物对AI的下一个时代至关重要。"
黄仁勋展示了一些物理AI的实例,包括能够生成视频来训练自动驾驶汽车的系统,以及能够按照提示生成不同场景(如狗、鸟、人)的AI。他解释道,当我们将推理系统、生成系统和物理AI结合起来,并将这种能力引入物理实体,就得到了机器人。
"如果你能想象提示AI生成视频来伸手拿起一个瓶子,当然你也能想象告诉机器人伸手拿起瓶子。今天的AI已经具备这些能力,这就是我们在不久的将来要去的方向。"
四、计算革命:Grace Blackwell与英伟达的AI基础设施
黄仁勋又详细介绍了英伟达开发的新计算架构Grace Blackwell,这是为了应对AI推理时间扩展的挑战而设计的。"过去三年,我们一直在开发一个新的计算机系统,使我们能够进行推理时间扩展,或者说极快地思考。因为当你思考时,你实际上是在你的头脑中生成大量的'tokens',生成大量的想法,并在产生答案之前在大脑中进行迭代。所以,过去的一次性AI现在将变成思考AI、推理AI、推理时间扩展AI,这将需要更多的计算。"
Grace Blackwell系统有两个关键能力:放大(scale up)和扩展(scale out)。黄仁勋解释了这两个概念的区别:"放大意味着将一台计算机变成一台巨型计算机;扩展是将一台计算机连接到多台计算机,让工作在多台不同的计算机上完成。扩展很容易,放大极其困难。建造超越半导体物理极限的更大计算机是极其困难的,这正是Grace Blackwell所做的。"
他宣布Grace Blackwell系统已全面投产:"尽管基于HGX的Blackwell系统自去年年底以来一直在全面生产,并自2月以来一直可用,但我们现在才刚刚将所有Grace Blackwell系统上线。它们每天都在各地上线。几周前,它已在Coreweave可用,许多CSP已经在使用它。现在你开始看到它出现在各个地方,每个人都开始推特说Grace Blackwell已全面投产。"
黄仁勋还宣布了Grace Blackwell的升级版GB 300:"正如我承诺的,我们每年都会提高平台性能,今年第三季度,我们将升级到Grace Blackwell GB 300。GB 300将保持相同的架构、相同的物理占用空间、相同的电气机械,但内部芯片已升级。它配备了新的Blackwell芯片,推理性能提高了1.5倍,HBM内存增加了1.5倍,网络能力提高了2倍,因此整体系统性能更高。"
接着,黄仁勋详细展示了Grace Blackwell的内部构造。他展示了计算节点:"这是B 200的样子,这是B 300的样子。注意中央这里,现在是100%液冷,但外部看起来是一样的,你可以将它插入相同的系统和机箱。这是Grace Blackwell GB 300系统,推理性能提高了1.5倍,训练性能基本相同,但推理性能提高了1.5倍。"
他指出,单个节点的性能约为40 petaflops,相当于2018年Sierra超级计算机的性能:"Sierra超级计算机有18,000个GPU,Voltage GPU。这一个节点取代了整个超级计算机,6年内性能提高了4,000倍,这是极端的摩尔定律。"
黄仁勋解释了英伟达如何实现如此巨大的性能提升:"制造更快的芯片或更大的芯片有一定的限制。在Blackwell的情况下,我们甚至将两个芯片连接在一起。TSMC与我们合作发明了一种新的协作工艺,称为Co-op L,使我们能够创建这些巨型芯片。但我们希望芯片更大,所以我们创建了NV-Link。"
他展示了NV-Link,这是世界上最快的交换机:"这个NV-Link的速度为7.2 terabytes/s。九个这样的交换机放入机架中,这九个交换机通过这个奇迹连接——NV-Link spine。两英里的电缆,5,000根结构化电缆,全部同轴,阻抗匹配。它将所有72个GPU连接到所有其他72个GPU,通过名为NV-Link交换机的网络。NV-Link spine的带宽为130 terabytes/s。"
黄仁勋做了一个令人惊讶的比较:"整个互联网的峰值流量为900 terabits/s,除以8。这一个NV-Link spine移动的流量比整个互联网还多,通过这个NV-Link,九个NV-Link交换机。这样,每个GPU都可以同时与其他所有GPU通信。"
他解释了系统的物理限制:"由于30s(传输标准)的驱动距离有限,这使得所有组件必须放在一个机架中。一个机架是120千瓦,这就是为什么一切都必须液冷的原因。我们现在能够将GPU从一个主板上分解出来,分布在整个机架上。整个机架实际上是一个主板,这就是奇迹。完全分解。"
黄仁勋强调,英伟达构建的几乎所有系统都是巨大的,因为"我们不是在建数据中心和服务器,我们在建AI工厂。"他展示了CoreWeave、Oracle Cloud和XAI Colossus工厂的例子:" 这是XAI Colossus工厂,这是Stargate,400万平方英尺,1千兆瓦。想想这个工厂,这个1千兆瓦的工厂可能会花费约60到80亿美元。在这60到80亿美元中,电子部分、计算部分、这些系统价值40到50亿美元。所以这些是巨大的工厂投资。人们建工厂的原因是,你们知道答案,买得越多,做得越多。这就是工厂的作用。"
五、NVLink Fusion:开放英伟达生态系统的新纪元
在介绍了英伟达强大的Grace Blackwell系统后,黄仁勋宣布了一项重大创新——NVLink Fusion,这一技术旨在开放英伟达的系统架构,使合作伙伴能够构建半定制的AI基础设施解决方案。
"今天我们宣布一个非常特别的事情——英伟达 NVLink Fusion。NVLink Fusion的目的是让你能够构建半定制AI基础设施,不仅仅是半定制芯片,因为那些是过去的好日子。你想要构建AI基础设施,而每个人的AI基础设施可能有些不同。有些人可能有更多的CPU,有些人可能有更多的英伟达 GPU,有些可能是某人的半定制ASIC。这些系统非常难以构建,它们都缺少一个令人难以置信的成分——NVLink。NVLink使你能够扩展这些半定制系统并构建真正强大的计算机。"
黄仁勋详细解释了NVLink Fusion的工作原理。他首先展示了英伟达平台,100%由英伟达组件构成:英伟达 CPU、英伟达 GPU、NVLink交换机、英伟达网络(称为Spectrum X或InfiniBand)、网络接口卡和交换机。然后他解释了如何将这个系统与其他公司的定制ASIC集成:
"现在,我们使你能够在计算层面上进行混搭。这就是你使用定制ASIC所做的事情。我们有很棒的合作伙伴,他们正在与我们合作,将你的特殊TPU、特殊ASIC或特殊加速器集成到大规模系统中。我们创建了一个NVLink芯片组,基本上是一个直接靠近你芯片的交换机。有IP可用于集成到你的半定制ASIC中。然后,它可以直接放入我提到的计算板中,融入我展示的AI超级计算机生态系统。"
黄仁勋还解释了如何使用NVLink Fusion集成合作伙伴的CPU:"也许你想使用自己的CPU。你已经开发自己的CPU一段时间了,也许你的CPU已经建立了非常大的生态系统,你想将英伟达集成到你的生态系统中。现在我们使这成为可能。你可以通过构建自定义CPU,我们提供NVLink芯片到芯片接口到你的ASIC,我们通过NVLink芯片组连接,现在它直接连接到Blackwell芯片和我们的下一代Rubin芯片。"
他强调这一创新使英伟达的生态系统对所有人开放:"这项令人难以置信的工作现在变得灵活,对所有人开放集成。你的AI基础设施可以有一些英伟达,很多你自己的;很多你自己的,你知道,很多CPU,很多ASIC,也许还有很多英伟达 GPU。无论如何,你都能受益于使用NVLink基础设施和NVLink生态系统,它与Spectrum X完美连接。所有这些都是工业级的,有一个由已经使其成为可能的大量工业合作伙伴组成的巨大生态系统。"
黄仁勋宣布了几家合作伙伴公司:"我们有一些很棒的合作伙伴:Lchip、Asterolabs、Marvell和我们的重要合作伙伴MediaTek将与我们合作,为想要构建这些东西的ASIC或半定制客户、超大规模数据中心提供服务。我们还有富士通和高通正在构建带有NVLink的CPU,以集成到我们的生态系统中。此外,我们与Cadence和Synopsys合作,将我们的IP转移给他们,使他们能够与所有人合作,使这些IP可用于所有人的芯片。"
六、DGX系列新成员:从桌面到服务器的AI革命
黄仁勋接着介绍了几款针对不同需求的新产品,这些产品旨在将AI计算能力扩展到更广泛的受众。
首先,他宣布DGX Spark已经进入全面生产:"DGX Spark将很快可用,可能在几周内。我们有着出色的合作伙伴:戴尔、惠普、华硕、微星、技嘉、联想,这些都是与我们合作的令人难以置信的伙伴。"
黄仁勋详细介绍了DGX Spark的定位:"这是为AI原生开发者设计的。如果你是开发者、学生、研究人员,不想一直打开云端,准备好后再清理,而是想在身边放一个自己的AI云,它始终开启,随时等待你使用。它允许你进行原型设计、早期开发。而且令人惊讶的是,DGX Spark拥有1 petaflops的算力和128 GB内存。"
他将DGX Spark与2016年推出的DGX1进行了对比:"在2016年,当我交付DGX1时,这也是1 petaflops的算力和128 GB内存。当然,这台是128 GB的HBM内存,而那台是128 GB的LPDDR5X。性能实际上非常相似,但最重要的是,你在这上面可以做的工作与在那上面做的工作是一样的。这是短短10年间取得的令人难以置信的成就。"
接着,黄仁勋展示了另一款产品——DGX工作站:"如果那还不够,你还想拥有自己的个人超级计算机,这是另一个桌面级产品,同样将由戴尔、惠普、华硕、技嘉、微星、联想以及Box、Landa等工作站公司提供。这将是你自己的个人DGX超级计算机。这台计算机是你从普通电源插座能获得的最大性能。你可以把它放在厨房里,但勉强能用。如果你把它放在厨房里,然后有人开微波炉,那就是极限了。这就是从普通电源插座能获得的极限。"
他强调了英伟达系统架构的一致性:"这台计算机和我展示的那些巨型系统的编程模型是一样的,这就是令人惊讶的地方。一种架构,一种架构,它有能力,有足够的容量和性能来运行一个参数达1万亿的AI模型。记住,llama是llama 70B。一个参数达1万亿的模型在这台机器上会运行得很好。"
七、企业级AI:重塑企业IT的全新视角
黄仁勋接着讨论了英伟达如何将AI引入传统企业IT。他解释道:"这些系统是AI原生的。它们是为这一新一代软件构建的计算机。它们不需要与x86兼容,不需要运行传统IT软件,不需要运行虚拟机管理器,不需要运行Windows。这些计算机是为现代AI原生应用设计的。当然,这些AI应用可以是由传统和经典应用调用的API。但为了将AI带入新世界,这个新世界是企业IT,我们必须回到根源,重新发明计算,将AI引入传统企业计算。"
他描述了企业计算的三个层次:"企业计算实际上有三个层次——它不仅仅是计算层。它是计算、存储和网络。一直都是计算、存储和网络。正如AI改变了一切,毫无疑问,AI也必须改变企业IT的计算、存储和网络。"
黄仁勋表示,下层必须完全重新发明,英伟达正在开发新产品来解锁企业IT。这些产品必须与传统IT行业兼容,同时增加新功能——代理AI:"基本上,数字营销活动经理、数字研究员、数字软件工程师、数字客户服务、数字芯片设计师、数字供应链经理,我们过去所做工作的数字版本、AI版本。正如我之前提到的,代理AI有能力推理、使用工具、与其他AI合作。所以,在很多方面,这些是数字工作者,数字员工。"
他提到了全球劳动力短缺问题:"世界面临严重的劳动力短缺。我们缺乏工作者。到2030年,短缺约为3000万至5000万,这实际上限制了世界的增长能力。现在我们有这些数字代理可以与我们一起工作。100%的英伟达软件工程师现在都有数字代理与他们合作,帮助他们开发更好的代码,提高生产力。"
黄仁勋描绘了企业的未来愿景:"在未来,你会有这一层——代理AI,AI代理。将会发生什么?企业会发生什么变化?正如我们为人类工作者设有人力资源部门,IT将成为数字工作者的人力资源部门。因此,我们必须为当今的IT行业、当今的IT工作者创建必要的工具,使他们能够管理、改进、评估在公司内工作的一系列AI代理。"
随后,黄仁勋宣布了新的企业级产品——RTX Pro Enterprise和Omniverse服务器:"这台服务器可以运行所有东西。它当然有x86,可以运行所有经典的虚拟机管理器。它运行Kubernetes和这些虚拟机管理器。因此,你的IT部门希望管理网络和管理集群并编排工作负载的方式完全相同。它甚至能够将Citrix和其他虚拟桌面流式传输到你的PC。今天世界上运行的所有东西都应该在这里运行。Omniverse在这里完美运行。但除此之外,这是企业AI代理的计算机。这些AI代理可能只是文本,也可能是计算机图形,小TJ来找你,小玩具珍珊来见你,帮助你工作。这些AI代理可以是文本形式、图形形式或视频形式。所有这些工作负载都在这个系统上运行。无论是什么模态,我们所知道的每一个模型、每一个应用程序都应该在这里运行。"
黄仁勋详细介绍了系统的性能:"这个RTX Pro企业级产品的性能,我在GTC上向大家展示了如何在AI工厂世界中考虑性能。考虑的方式是吞吐量,y轴是每秒tokens,工厂输出越多,产生的tokens就越多。所以吞吐量衡量的是每秒tokens。然而,每个AI模型都不一样,有些AI模型需要更多的推理,所以每个用户的性能必须很高。每秒每用户tokens必须很高。这就是工厂的问题——工厂要么喜欢高吞吐量,要么喜欢低延迟,但不喜欢两者兼而有之。"
他介绍了企业级服务器的性能特点:"Hopper是我们最著名的计算机,H100,HGX,22.5万美元的Hopper在那下面。而我刚才展示的Blackwell服务器,企业级服务器,其性能是其1.7倍。但最令人惊讶的是,这是Llama 70B的性能,这是DeepSeek R1的性能。DeepSeek R1是4倍。DeepSeek R1已经被优化,这真是世界AI行业的礼物。计算机科学突破的数量真的相当可观,为美国和世界各地的研究人员开辟了大量优秀的研究。无论我去哪里,DeepSeek R1都对人们如何思考AI,如何思考推理和推理AI产生了实质性影响。他们为行业和世界做出了巨大贡献。"
八、AI存储革命:从结构化到非结构化的查询转变
黄仁勋接着讨论了AI如何改变存储平台。他解释道:"人类查询结构化数据库,如SQL。人们查询结构化数据库,如SQL。但AI想要查询非结构化数据。它们想要语义,想要意义。所以我们必须创建一种新型的存储平台。"
他介绍了英伟达 AI数据平台:"就像SQL服务器、SQL软件和你合作的存储供应商的文件存储软件一样,有一层非常复杂的软件与存储相关。大多数存储公司,正如你所知,主要是软件公司。这层软件非常复杂。所以在新型存储系统之上将是一个新的查询系统,我们称之为IQ,英伟达 AI-Q或IQ。这真的是最先进的,非常出色。"
黄仁勋解释了为什么未来的存储需要GPU:"你未来的存储不再是CPU坐在存储机架之上,而是GPU坐在存储机架之上。原因是因为你需要系统嵌入、在非结构化数据、原始数据中找到意义。你必须索引,进行搜索,并进行排名。这个过程需要很多计算能力。因此,大多数未来的存储服务器都会在前面有一个GPU计算节点。"
他强调了AI模型在这一过程中的核心作用:"几乎所有我将要展示的东西都从优秀的AI模型开始。我们创建AI模型,我们在开放AI模型的训练后投入大量精力和技术。我们训练,用完全透明的数据对这些AI模型进行训练后的加工。这是安全可靠的数据,可以用于训练,我们提供这个列表供你查看。所以这完全透明,我们提供数据给你。我们对模型进行训练后的加工,而我们训练后的模型性能确实令人难以置信。它现在是可下载的开源推理模型,Llama Nemotron推理模型是世界上最好的,下载量巨大。"
黄仁勋还提到了IQ的性能优势:"它比现有产品快15倍,查询结果提升50%。这些模型全部可供你使用,IQ蓝图是开源的。我们与存储行业合作,将这些模型集成到他们的存储堆栈、他们的AI平台中。"
九、AI运营:企业AI的新管理层
在讨论完计算和存储平台后,黄仁勋介绍了一个新的软件层——AI运营(AI Ops):"正如供应链有其运营,人力资源有其运营,未来IT将有AI运营。他们将策划数据,微调模型,评估模型,设置模型的护栏,保护模型安全。我们有大量的库和模型,必须集成到AI运营生态系统中。"
他列举了与英伟达合作推广这一技术的合作伙伴:"CrowdStrike正在与我们合作,Data IQ正在与我们合作,Data robots正在与我们合作。这些都是AI运营,为企业中的代理AI创建微调模型和部署模型。英伟达库和模型集成在其中。这里是data robots,这是data stacks,这是elastic。我听说他们被下载了4000亿次。Nutanix,Red Hat,Trend Micro,Weights and Biases。"
黄仁勋总结道:"这就是我们如何为世界的企业IT带来将AI添加到你所做的一切的能力。你不会从企业IT组织中拆除所有东西,因为公司必须运行。但我们可以将AI添加进去。现在我们有了企业就绪的系统,有着令人难以置信的生态系统合作伙伴。"
十、机器人革命:从AI到物理实体
黄仁勋讨论了英伟达在机器人领域的工作,将之前的AI话题与机器人技术联系起来:"代理AI,具有代理性的AI,AI代理,很多不同的说法,代理本质上是数字机器人。原因是因为机器人感知、理解和计划。这基本上就是代理所做的事情。但我们也想构建物理机器人。这些物理机器人首先要能够学习成为机器人。"
他解释了为什么模拟对机器人学习至关重要:"在物理世界中学习成为机器人是不可能高效进行的。你必须创建一个虚拟世界,让机器人学习如何成为一个好机器人。这个虚拟世界必须遵守物理定律。大多数物理引擎没有能力处理刚体和软体模拟的保真度。因此,我们与DeepMind、谷歌DeepMind和迪士尼研究院合作构建了Newton,这是世界上最先进的物理引擎。它将在7月开源。它能做的事情令人难以置信。它完全由GPU加速,是可微分的,所以你可以从经验中学习。它有着令人难以置信的高保真度,超实时。我们可以使用Newton引擎,它已集成到MuJoCo和英伟达的Isaac Sim中。"
黄仁勋展示了一段机器人模拟视频,解释道:"那不是动画,而是模拟。它在沙子、泥土中滑动。所有这些都是模拟的。机器人的软件在模拟中运行。所以它不是动画,而是模拟。因此,在未来,我们将把训练好的AI模型放入模拟中的机器人中,让它学习如何成为一个优秀的机器人。"
他介绍了英伟达在自动驾驶和机器人系统方面的工作:"我们的自动驾驶汽车基本上有三个系统。有用于创建AI模型的系统,那就是GB 200,GB 300。它将用于训练AI模型。然后你有Omniverse来模拟AI模型。然后,当你完成该AI模型后,你将该模型,即AI,放入自动驾驶汽车中。今年,我们正在全球部署梅赛德斯,我们的自动驾驶汽车堆栈,端到端堆栈。"
黄仁勋解释了英伟达的市场策略:"我们创建整个堆栈,我们开放整个堆栈。然后对于我们的合作伙伴,他们使用他们想使用的任何东西。他们可以使用我们的计算机而不使用我们的库。他们可以使用我们的计算机、我们的库,也可以使用我们的运行时。你想使用多少,由你决定。因为有很多不同的工程团队、不同的工程风格和不同的工程能力。我们希望确保以尽可能简单的方式提供我们的技术,让每个人都能轻松集成英伟达的技术。"
他宣布了英伟达在机器人系统方面的新平台:"我们在机器人系统中做的事情与汽车完全相同。这是我们的Isaac Gr00t平台。模拟与Omniverse完全相同。计算、训练系统是相同的。当你完成模型后,你将其放入这个Isaac Gr00t平台中。Isaac Gr00t平台从一款名为Jetson Thor的全新计算机开始。它刚刚开始生产,是一款令人难以置信的处理器。基本上,机器人处理器用于自动驾驶汽车和人形机器人系统。上面是我们称为英伟达 Isaac的操作系统。英伟达 Isaac操作系统是运行时。它进行所有神经网络处理、传感器处理、管道,所有这些,并提供执行结果。然后上面是我们创建的预训练模型,由一个令人惊叹的机器人团队预训练这些模型。我们提供创建这一切所需的所有工具,包括模型。"
黄仁勋宣布:"今天我们宣布Isaac Gr00t N1.5现已开源。它向全世界开放使用。它已经被下载了6000次。社区的欢迎、喜爱和赞赏是令人难以置信的。"
他还介绍了英伟达如何通过AI扩大人类演示系统,创建更多的机器人训练数据:"机器人领域最大的挑战是数据策略。在机器人的情况下,人类演示,就像我们向孩子演示或教练向运动员演示一样。你通过远程操作向机器人演示如何执行任务。机器人可以从这种演示中泛化。因为AI可以泛化,我们有泛化技术。你可以从那一个演示中泛化其他技术。"
他解释了英伟达的Gr00t Dreams技术如何解决数据挑战:"如果你想教这个机器人大量技能,需要多少不同的远程操作人员?结果是很多。所以我们决定使用AI来扩大人类演示系统。这基本上是从真实到真实,使用AI帮助我们扩大在人类演示期间收集的数据量,以训练AI模型。"
十一、数字孪生与工业AI:台湾地区领先企业的应用案例
黄仁勋展望了机器人技术和数字孪生如何改变制造业。他指出:"一切移动的东西都将是机器人。当我们将这些机器人放入工厂时,记住,工厂本身也是机器人。今天的工厂非常复杂。"
他展示了几家台湾企业如何应用Omniverse创建数字孪生:"为了创建在工厂中作为一个舰队、一个团队一起工作的机器人并设计这些机器人,工厂本身也是机器人,我们必须给它Omniverse来学习如何一起工作。数字孪生,你现在有机器人的数字孪生,你有所有设备的数字孪生,你将有工厂的数字孪生。这些嵌套的数字孪生将是Omniverse能够做的事情的一部分。"
黄仁勋展示了台湾领先企业的数字孪生案例,包括台达电子、纬创、广达、鸿海、技嘉和台积电:"TSMC正在为下一个晶圆厂建造数字孪生。随着我们说话,全世界正在规划5万亿美元的工厂。未来三年,5万亿美元的新工厂。因为世界正在重塑,因为再工业化在世界各地移动,新工厂到处都在建设。这是一个巨大的机会,让我们确保他们建设良好,成本效益高,准时完成。"
他还提到了城市级别的数字孪生项目:"他们为高雄建造了数字孪生。已经有数十万座建筑,数百万公里的道路。"
十二、英伟达 Constellation:新办公大楼计划
在演讲的最后部分,黄仁勋宣布了英伟达在中国台湾的新办公大楼计划:"我们一直在太空船坞建造一段时间了,我想是时候揭开我们建造的最大产品之一了。它停在外面等着我们。英伟达 Constellation。"
他解释了建设新办公室的原因:"正如你所知,我们一直在增长。我们与你们的所有合作伙伴关系都在增长。我们在台湾的工程师数量一直在增长。所以我们正在超越当前办公室的限制。所以我将为他们建一个全新的英伟达台湾办公室。它叫做英伟达 Constellation。"
黄仁勋还宣布了新办公室的地点:"我们一直在选择地点,所有不同城市对我们都非常友善。我想我们得到了一些不错的交易。我不确定,因为似乎相当昂贵,黄金地段就是黄金地段。今天我很高兴地宣布,英伟达 Constellation将位于北投士林。我们已经与该租约的当前所有者协商转让租约。"
他以幽默的方式寻求现场观众的支持:"然而,我了解到,为了让租约尽快通过,市长想知道市民是否同意我们在这里建一个大型、美丽的英伟达 Constellation。你们同意吗?他要求你们给他打电话。所以我相信你们知道他的号码。每个人立即给他打电话。告诉他你认为这是个好主意。这将是英伟达 Constellation。我们将建造它。我们将尽快开始建设。我们需要办公空间。英伟达 Constellation,北投士林。非常令人兴奋。"
黄仁勋在总结演讲时表达了对当地合作伙伴的感谢和对未来的展望:"我想感谢你们多年来的合作。我们正面临一个千载难逢的机会。说我们面前的机会非凡,这绝不是夸大其词。在我们共处的时间里,第一次,我们不仅仅是在创造下一代IT。我们已经做过几次了。从PC到互联网到云到移动云。我们已经做过几次了。但这一次,我们不仅创造了下一代IT,我们实际上正在创造一个全新的产业。这个全新的产业将使我们面临巨大的机遇。"
他展望了与合作伙伴的未来合作:"我期待与你们所有人合作,建设AI工厂、企业代理、机器人。你们都是与我们一起围绕一个架构构建生态系统的优秀合作伙伴。"
从始至终,黄仁勋一直在强调AI将改变各行各业,包括自身产业。正如他在开篇所言:"GeForce把AI带给了世界,然后AI回来改变了GeForce。你们把AI带给了世界,现在AI将回来改变你们所做的一切。"