在拉斯维加斯举行的2025年国际消费电子展上,英伟达首席执行官黄仁勋发布了一项里程碑式公告,正式推出公司突破性的鲁宾计算架构。这标志着人工智能硬件发展的一个关键时刻,有望加速全球各行业的人工智能能力提升。
英伟达于今日正式推出其鲁宾计算架构,这代表了该公司迄今为止最先进的人工智能硬件平台。该架构以天文学家薇拉·鲁宾命名,并已立即进入全面生产阶段,预计将于2025年下半年开始大规模部署。此公告发布之际,正值人工智能发展的关键节点,人工智能系统的计算需求正呈指数级增长。
在其主题演讲中,黄仁勋强调了该架构的根本目的。他表示:“薇拉·鲁宾解决了我们的核心挑战:人工智能计算需求正在急剧飙升。今天,我确认薇拉·鲁宾已进入全面生产。”鲁宾平台接替了布莱克威尔架构,延续了英伟达的硬件加速开发周期,这一周期已推动该公司成为全球市值最高的企业。
鲁宾架构包含六款专为无缝集成而设计的专用芯片。其核心是鲁宾GPU,但该系统通过多项关键创新解决了更广泛的计算瓶颈:
增强的存储解决方案:新的外部存储层级与计算设备连接,能够为人工智能工作负载更高效地扩展存储池。
先进的互连技术:改进的NVLink和Bluefield系统促进了组件间更快的数据传输。
专用处理单元:Vera CPU组件专门专注于智能体推理能力。
内存优化:增强的KV缓存管理应对了现代人工智能系统日益增长的内存需求。
英伟达人工智能基础设施解决方案高级总监迪翁·哈里斯在一次技术简报中解释了存储创新。他指出:“现代人工智能工作流,特别是智能体人工智能和长期任务,对KV缓存系统造成了巨大压力。我们的新存储层级允许存储资源与计算能力一同实现更高效的扩展。”
根据英伟达的内部测试,鲁宾架构相比其前代产品带来了显著的性能提升:
任务类型:模型训练 | 性能提升:比布莱克威尔快3.5倍 | 效率增益:显著减少训练时间
任务类型:推理任务 | 性能提升:比布莱克威尔快5倍 | 效率增益:每瓦特提供8倍推理计算
任务类型:峰值性能 | 性能提升:高达50千万亿次浮点运算 | 效率增益:优化的功耗
这些性能指标确立了鲁宾作为当前最高效的人工智能计算平台的地位,同时解决了随着人工智能全球扩展而日益重要的速度和能耗问题。
主要科技公司已承诺在其基础设施中部署鲁宾系统。几乎每一家领先的云服务提供商都计划集成鲁宾芯片,包括与多家知名公司的高调合作。此外,研究机构已宣布计划将鲁宾架构纳入下一代超级计算项目。
关键部署包括:惠普企业的蓝狮超级计算机实施、劳伦斯伯克利国家实验室即将推出的杜德纳超级计算机、跨多个云平台的企业人工智能基础设施,以及专注于先进人工智能开发的研究机构。
这种广泛的采用反映了该架构预计将对各领域人工智能发展时间表和能力产生的影响。
鲁宾的发布正值人工智能基础设施资源竞争激烈之际。无论是人工智能研究实验室还是云服务提供商,都在争相获取先进的计算硬件及其所需的运行设施。在2025年10月的一次财报电话会议上,黄仁勋预测了大规模的基础设施投资,估计未来五年内将有3万亿至4万亿美元资金投入人工智能基础设施开发。
这一预测凸显了像鲁宾这样的硬件进步在实现下一代人工智能能力方面的战略重要性。该架构面世之时,大型语言模型、生成式人工智能系统和自主智能体对计算的需求持续扩大,已超出先前的预期。
鲁宾代表了英伟达加速硬件发展时间线上的最新迭代。该架构接替了布莱克威尔平台,而布莱克威尔本身又继承了霍珀和拉芙莱斯架构。这种快速的进步反映了为跟上人工智能计算需求所需的非凡创新速度。
英伟达首次在2024年宣布鲁宾架构,当时预计该平台将解决人工智能计算中出现的瓶颈问题。近年来,该公司的发展周期已显著压缩,从主要架构之间相隔数年,转变为更频繁、能重新定义计算能力的实质性更新。
这一加速的时间线反映了更广泛的人工智能产业的快速演变,其中硬件限制日益决定软件和模型开发的步伐。鲁宾的设计专门针对上一代人工智能系统广泛部署期间出现的约束。
鲁宾架构的进步超越了原始计算能力。其多项特性专门针对新兴的人工智能发展需求:
智能体人工智能支持:Vera CPU组件为自主人工智能智能体实现了更复杂的推理能力。
扩展上下文处理:增强的内存系统支持更长的输入序列和更复杂的任务。
多模态处理:针对文本、图像、音频和视频数据同步处理的优化架构。
可扩展性改进:跨分布式计算环境实现更高效的扩展。
这些能力使鲁宾成为下一代人工智能应用的基础平台,这些应用需要更复杂的推理、更长期的记忆和复杂的多模态理解。
鲁宾改进的能效解决了人们对人工智能环境影响日益增长的担忧。该架构在每瓦特推理计算上实现的八倍提升,代表着可持续人工智能发展方面的重大进步。随着人工智能系统在全球基础设施中扩展,这一效率增益变得愈发重要。
此外,该架构的设计有助于实现更高效的冷却和配电,从而降低大规模部署的运营成本。随着能源消耗问题与计算需求一同加剧,这些考量已成为数据中心设计和人工智能基础设施规划的关键因素。
随着鲁宾架构逐步落地,其对人工智能生态系统的影响力将持续放大。从科研机构到企业级应用,再到边缘智能部署,该平台将成为推动算力跃迁的核心引擎。与此同时,围绕高性能计算的市场竞争也日趋白热化,平台选择与生态协同能力正成为决定成败的关键。
对于希望参与加密资产交易的用户,可以选择在币安或欧易等知名平台进行注册和交易。币安和欧易提供多币种交易、低手续费和稳定服务,用户可通过官网或 App 下载快速注册,畅享便捷投资体验。无论是关注AI芯片动向的投资者,还是布局未来数字资产的用户,均可通过币安官方网或欧易官方网获取权威信息与安全接入通道。
问题一:什么是英伟达鲁宾架构?
解答:英伟达鲁宾架构是一个专为人工智能工作负载设计的综合性计算平台。它由六款专用芯片组成,包括一个中央GPU、增强的存储系统、改进的互连技术以及一个用于智能体推理的专用CPU。
问题二:鲁宾与英伟达之前的架构相比如何?
解答:鲁宾代表了相对于布莱克威尔架构的重大进步,提供快3.5倍的模型训练速度、快5倍的推理性能以及每瓦特多8倍的推理计算。它还引入了针对新兴人工智能需求(如智能体推理和扩展内存系统)的专用组件。
问题三:鲁宾芯片何时可供部署?
解答:英伟达已宣布鲁宾架构已进入全面生产阶段,预计将于2025年下半年开始大规模部署。主要的云服务提供商和研究机构已承诺实施鲁宾系统。
问题四:鲁宾架构的关键创新有哪些?
解答:关键创新包括用于高效扩展的新外部存储层级、增强的NVLink互连系统、用于智能体推理的Vera CPU,以及针对现代人工智能模型中使用的KV缓存系统的优化内存管理。
问题五:鲁宾将如何影响人工智能发展和研究?
解答:鲁宾的性能改进和专用功能将加速人工智能研究时间表,实现更复杂的人工智能应用,并减少多模态处理、长上下文理解和自主智能体开发等复杂任务的计算障碍。