123cha:提供安全、无毒的游戏、软件资源下载!

您当前位置: 首页 · 游戏攻略 · 正文

NeurIPS 2025上NVIDIA发布了开源的自动驾驶推理模型

作者:LSY 发布时间:2025-12-03 16:08:04

在NeurIPS 2025大会上,NVIDIA发布了一套全新的开放模型、数据集与工具,覆盖自动驾驶、语音人工智能及安全研究等领域,进一步巩固了其在开放数字与实体人工智能开发领域的地位。

公司还获得了Artificial Analysis新推出的开放指数的认可,该指数把NVIDIA的Nemotron系列评定为最透明的模型生态系统之一。

NVIDIA 发布了 DRIVE Alpamayo-R1,公司称其为“全球首个用于自动驾驶的开放推理 VLA 模型”。

NVIDIA应用深度学习研究副总裁Bryan Catanzaro表示,该模型将思维链推理与路径规划相结合,支持复杂道路场景和四级自主性的研究。

据英伟达介绍,AR1 会逐步拆解场景,考虑可能的轨迹,并利用上下文数据确定路线。其部分训练数据可通过NVIDIA的Physical AI Open Datasets获取,模型也可在GitHub和Hugging Face访问。

AR1基于NVIDIA Cosmos Reason,可定制用于非商业研究。NVIDIA表示,强化学习在模型后训练中非常有效,提升了其推理性能,相较于预训练版本。公司还发布了AlpaSim,一个用于评估AR1的开放框架。

此外,NVIDIA 在《宇宙手册》中通过新工具和工作流程扩展了 Cosmos 生态系统,为模型后训练、合成数据生成和评估提供了逐步指导。

基于Cosmos的新系统包括LidarGen,一个用于生成激光雷达数据的世界模型;Omniverse NuRec Fixer,用于纠正神经重建中的伪影;Cosmos政策将视频模型转化为机器人政策;以及ProtoMotions3,一个用于训练物理模拟数字人和机器人的框架。

行业合作伙伴,包括Voxel51、1X、Figure AI、Foretellix、Gatik、Oxa、PlusAI和X-Humanoid,正在使用Cosmos世界基础模型。苏黎世联邦理工学院的研究人员展示了NeurIPS的研究,展示了Cosmos模型如何生成连贯的三维场景。

在数字人工智能领域,NVIDIA推出了Nemotron和NeMo旗下的新模型和数据集。其中包括MultiTalker Parakeet,一种用于多说话环境的语音识别模型;Sortformer,一种日历模型;以及Nemotron内容安全推理,该公司表示该推理应用了领域特定的安全规则。

NVIDIA还开放了Nemotron内容安全音频数据集,用于检测不安全音频内容。还发布了合成数据和强化学习工具,包括用于强化学习环境的NeMo Gym和NeMo数据设计器库,后者现已在Apache 2.0下开源。

CrowdStrike、Palantir以及ServiceNow等合作伙伴,正借助Nemotron与NeMo工具来开展专门的代理人工智能相关工作。

热门游戏
精选攻略
查看更多 +
火爆手游榜
  1. 1 希露薇的计划超级魔改

    希露薇的计划超级魔改

    2025-12-17更新
    查看
  2. 2 anothergirlinthewall汉化版

    anothergirlinthewall汉化版

    2025-12-17更新
    查看
  3. 3 我是公寓管理员安卓汉化版游戏

    我是公寓管理员安卓汉化版游戏

    2025-12-17更新
    查看
  4. 4 魔女的囚禁

    魔女的囚禁

    2025-12-17更新
    查看
  5. 5 甜心宝贝cutehoney中文版

    甜心宝贝cutehoney中文版

    2025-12-17更新
    查看
  6. 6 女间谍败北

    女间谍败北

    2025-12-17更新
    查看
  7. 7 重启生涯安卓汉化版

    重启生涯安卓汉化版

    2025-12-17更新
    查看
  8. 8 唱舞星计划

    唱舞星计划

    2025-12-17更新
    查看
  9. 9 幽灵牛奶生活

    幽灵牛奶生活

    2025-12-17更新
    查看
  10. 10 害羞的椎名酱

    害羞的椎名酱

    2025-12-17更新
    查看
专题推荐
更多