国产开源世界模型来了 蚂蚁灵波四连发
近日,全球人工智能领域接连迎来重要进展。1月27日至30日,蚂蚁集团旗下灵波科技连续四天密集开源发布四大核心模型——空间感知模型LingBot-Depth、具身大模型LingBot-VLA、世界模型LingBot-World、具身世界模型LingBot-VA,构建了一套完整的开源具身智能开发套件。尤为引人注目的是,就在蚂蚁灵波宣布其世界模型开源的次日,全球科技巨头谷歌紧随其后,宣布面向美国特定用户开放其世界模型项目Project Genie的体验平台。

这一系列动作标志着长期以来由少数巨头把持的世界模型壁垒首次被中国科技企业以开源方式撕开关键缺口,世界模型竞赛正从封闭研发加速转向开放生态的协同演进。德国财经媒体AdHocNews评论称,蚂蚁集团发布的LingBot-World高质量机器人AI模拟环境完善了一套完整的开源工具包,用于物理AI系统的开发,这也是在全球机器人领域话语权争夺战中的一项战略性举措。

自1月27日起,蚂蚁灵波开启了一场具身智能领域的模型开源周。1月27日,率先开源LingBot-Depth空间感知模型,该模型专为提升机器人等智能终端的三维视觉精度与可靠性而设计,在多项国际基准测试中达到领先水平。1月28日,灵波科技开源具身大模型LingBot-VLA,基于超过2万小时的真实机器人数据预训练,覆盖9种主流双臂机器人构型,解决了具身智能落地中的泛化性挑战和成本高企问题。仅需少量演示数据,该模型即可实现高质量任务迁移,大幅降低了下游应用的适配门槛与成本。

1月29日,世界模型LingBot-World正式亮相,旨在为具身智能、自动驾驶及游戏开发提供高保真、可实时操控的虚拟环境。官方资料显示,该模型在视频生成质量、动态程度、长时一致性等关键指标上均媲美谷歌同期发布的Genie 3模型。更突出的是,LingBot-World成功攻克了视频生成中常见的“长时漂移”难题,实现了近10分钟的连续稳定生成,并将端到端交互延迟控制在1秒以内,支持用户通过文本或操作实时改变环境。

欢迎广大网友来本网站投稿,网站内容来自于互联网或网友提供 客服QQ:2685213839