智元发布GO-1大模型,加速人形机器人产业化
AI导读:
智元机器人发布首个通用具身基座大模型GO-1,性能大幅提升,助力机器人完成多样化任务。GO-1大模型加速具身智能普及,推动人形机器人从特定任务工具向通用智能自主体发展,或迎来迅速产业化。
最近,华为离职“天才少年”彭志辉的官宣在互联网刷屏。紧接着,智元启元大模型如期而至,为科技界再添一把火。
智元机器人官微宣布,正式发布首个通用具身基座大模型Genie Operator-1(GO-1),并附上视频,展示GO-1通过学习人类视频,助力机器人完成递送水杯、制作餐点、迎接外宾等多样化任务。视频末尾还揭秘了仿真数据采集及大规模真机数据采集的全过程。
从性能上看,GO-1相比现有模型,成功率大幅提升,平均提高了32%。实验证明,GO-1在“倒水”“清理桌面”“补充饮料”等日常任务中尤为出色。

智元机器人透露,为充分利用高质量的AgiBot World数据集及互联网大规模异构视频数据,增强策略泛化能力,提出了Vision-Language-Latent-Action(ViLLA)架构。
去年底,智元机器人携手上海人工智能实验室等单位,宣布开源百万真机数据集项目AgiBot World。该项目覆盖超100种真实场景,其中家居场景占比40%,工业场景占比20%,共收录80余种人类生活必备技能。
然而,智元机器人指出,尽管AgiBot World等带动作标签的真机数据量已有一定规模,但与互联网数据集相比仍显不足。基于ViLLA架构,采用Latent Actions(隐式动作)建模,将外部动作知识融入通用操作任务中,有效弥补这一不足。
据悉,GO-1大模型融合了人类与多种机器人数据,能快速适应新任务,并支持部署于不同机器人本体。智元机器人将GO-1的特点总结为四点:
人类视频学习:GO-1大模型结合互联网视频与真实人类示范,深化对人类行为的理解。
小样本快速泛化:GO-1大模型具备卓越泛化能力,在极少数据甚至零样本条件下,也能迅速适应新场景、新任务。
一脑多形:GO-1大模型作为通用机器人策略模型,可在不同机器人形态间灵活迁移。
持续进化:GO-1大模型搭配智元的数据回流系统,从实际执行中遇到的问题数据中不断学习进化。
智元机器人展望,GO-1大模型将加速具身智能的普及,推动机器人从特定任务工具向通用智能自主体转变。
当前,基础模型发展迅速。信达证券分析指出,AI的飞速发展为人形机器人和自动驾驶等端侧领域带来革命性突破。Grok3/o3-mini等模型展现出对物理定律的深刻理解,而Deepseek相关模型则揭示了推理成本的急剧下降。受此鼓舞,端侧高级智能应用的落地指日可待,人形机器人或将迎来产业化高潮。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。