栏目分类
新闻动态
智元机器人发布行业首个机器人统一世界模型开源平台Genie Envisioner
发布日期:2025-08-20 13:46 点击次数:163
8月14日,智元机器人宣布推出面向真实世界机器人操控的行业首个统一世界模型平台——Genie Envisioner(GE)。不同于传统“数据—训练—评估”割裂的流水线模式,GE将未来帧预测、策略学习与仿真评估首次整合进以视频生成为核心的闭环架构,使机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。
智元机器人称,基于3000小时真机数据,GE-Act不仅在跨平台泛化和长时序任务执行上显著超越现有SOTA,更为具身智能打开了从视觉理解到动作执行的全新技术路径。
GE的核心突破在于构建了基于世界模型的以视觉中心的建模范式。不同于主流VLA(Vision-Language-Action)方法依赖视觉-语言模型将视觉输入映射到语言空间进行间接建模,GE直接在视觉空间中建模机器人与环境的交互动态。这种方法完整保留了操控过程中的空间结构和时序演化信息,实现了对机器人-环境动态更精确、更直接地建模。
智元机器人表示,团队将开源全部代码、预训练模型和评测工具。未来,将扩展更多传感器模态,支持全身移动与人机协作,持续推动智能制造与服务机器人的落地应用。

