NVIDIA发布了Cosmos,一种开源、开放权重的视频世界模型

NVIDIA发布了Cosmos,一种开源、开放权重的视频世界模型
2025年01月07日 17:03 黄建同学
NVIDIA发布了Cosmos,一种开源、开放权重的视频世界模型。它基于 2000 万小时的视频进行训练,权重从 40 亿到 140 亿。Cosmos 提供两种风格:扩散(连续标记)和自回归(离散标记);以及两种生成模式:文本->视频和文本+视频->视频。另外,Cosmos项目也是一个世界模型开发平台,由世界基础模型、Tokenizers和视频处理工作流组成,旨在加速机器人和 AV 实验室的物理 AI 开发。Cosmos 专为物理 AI 而构建。Cosmos 存储库将使最终用户能够运行 Cosmos 模型、运行推理脚本并生成视频。按照Jim Fan的说法:合成数据将解决 物理 AI 面临的大数据短缺问题!Nividia已经将 Cosmos 应用于机器人和自动驾驶的大规模合成数据生成,现在开放给大家来使用,任何人都可以来微调数据,训练机器人AI。访问:#ai创造营##科技##ChatGPT[超话]#

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部