找回密码
 立即注册

QQ登录

只需一步,快速开始

广告载入中...
查看: 171|回复: 1

清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平

[复制链接]
发表于 2025-7-25 14:30 | 显示全部楼层 |阅读模式

马上注册,享用更多功能,让你轻松玩转本论坛。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
13:45 【训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平】机器人能通过普通视频来学会实际物理操作了!来看效果,对于所有没见过的物品,它能精准识别并按照指令完成动作。比如清理桌面垃圾,或者是从零食筐里找到人类想要的糖果。这就是清华大学与生数科技最新联合研发的Vidar模型,首次让通用视频大模型长出了“手脚”,通过少样本泛化能力,实现从虚拟的Dream World到真实世界Real World物理执行的关键跨越。它在互联网级视频数据预训练的基座模型Vidu上,使用百万异质机器人视频数据进行再训练。仅用20分钟机器人真机数据,即可快速泛化到新的机器人本体,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一,大幅降低了在机器人上大规模泛化的数据门槛。
发表于 2025-7-28 23:41 | 显示全部楼层
好好学习天天向上
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表