可玩可交互!业界首个媲美Genie 3的开源世界模型
今天蚂蚁灵波科技再次刷新行业预期,开源发布世界模型LingBot-World。该模型在视频质量、动态程度、长时一致性、交互能力等关键指标上均媲美Google Genie 3。旨在为具身智能、自动驾驶及游戏开发提供高保真、高动态、可实时操控的“数字演练场”。针对视频生成中最常见的“长时漂移”问题,LingBot-World实现了近10分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。交互性能上,LingBot-World可实现约16 FPS的生成吞吐,并将端到端交互延迟控制在1秒以内。用户可通过键盘或鼠标实时控制角色与相机视角,画面随指令即时反馈。此外,用户可通过文本触发环境变化与世界事件,例如调整天气、改变画面风格或生成特定事件,并在保持场景几何关系相对一致的前提下完成变化。同时,该模型具备Zer