在NeurIPS人工智能大会上,英伟达宣布推出面向物理与数字领域的新一代AI工具及开源模型开发平台,其中包括专为自动驾驶设计的Drive Alpamayo-R1模型。这家科技巨头表示将持续扩展其开源AI模型、工具及数据集的生态体系。
英伟达强调,新型开源物理与数字AI模型旨在为人工智能及其他领域的研究提供支持。其推出的Alpamayo-R1被誉为全球首个面向自动驾驶汽车的工业级开源推理视觉语言行动模型。该公司还透露即将发布专注于AI安全与语音技术的新数据集与模型。据悉,英伟达研究人员为本届大会准备了70余篇论文、专题研讨及技术演讲,涵盖医学研究、自动驾驶与AI推理等前沿领域。
在本次AI盛会上,英伟达展现出对开源生态的更坚定承诺。AI基准测试平台最新发布的开源指数将其Nemotron系列AI工具评为行业标杆,该评级基于技术资料共享程度、模型许可易用性及数据使用规范透明度等多维指标。
Alpamayo-R1通过整合思维链推理与路径规划技术,实现了L4级自动驾驶能力,显著提升多种道路场景下的行车安全。相比早期自动驾驶模型在行人密集路口、自行车道违停车辆或道路封闭等复杂场景中的表现,新一代模型凭借类人推理能力实现了突破。该模型通过分解场景要素、逐步推演可能结果,并基于上下文数据确定最优行动方案。
AR1模型依托思维链推理架构,能够实时处理路径数据并规划轨迹,例如对违规穿行的行人做出避让响应。其开源基础架构基于Cosmos推理系统,支持研究人员针对非商业应用场景进行定制化开发。开发者可通过Hugging Face与GitHub平台获取该模型,部分训练评估数据集已发布于英伟达物理AI开放数据集平台。
研究团队证实强化学习在AR1的后训练阶段成效显著。开发者可参照分步推理指南掌握基于Cosmos的模型使用与后期训练方法。开源教程中提供了快速启动推理与高级后训练的完整案例,涵盖数据预处理、模型评估到合成数据生成的完整流程。
基于Cosmos的应用开发前景广阔,目前已衍生出激光雷达数据生成、机器人仿真修正、策略规划及仿生运动框架等创新方案。其中激光雷达生成模型首创了面向自动驾驶仿真的点云数据生成技术,机器人仿真模块则整合了英伟达预测系统。全新推出的开源框架搭载GPU加速技术,能够训练物理模拟人形机器人及数字人,而世界基础模型可生成高度逼真的虚拟场景。策略模型训练平台支持机器人模型的后期训练数据生成,持续推动智能体能力进化。