AI导读:

蚂蚁集团使用国产AI芯片训练大模型,推出百灵轻量版与增强版,实现低性能硬件高效训练,降低成本近20%。同时,蚂蚁加码AI应用与人形机器人领域,探索新的增长点。

蚂蚁集团使用国产AI芯片训练大模型,这一创新举措有望进一步降低AI训练成本,提升效率。近日,蚂蚁集团Ling团队发表了一篇技术成果论文,详细介绍了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus)。其中,Ling-Lite参数规模为168亿,Ling-Plus基座模型参数规模高达2900亿,两者性能均达到行业领先水平。

除了自研性能领先的大模型,蚂蚁集团此次技术论文的最大突破在于提出了一系列创新方法,旨在提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片的同规模模型相当。这一成果对于推动AI技术向普惠化方向发展具有重要意义。

蚂蚁集团自研大模型实现低性能硬件高效训练

蚂蚁集团Ling团队的技术成果论文已发表在预印版Arxiv平台上。论文指出,虽然Deepseek、阿里通义千问等MoE大模型在特定任务中展现出卓越性能,但其训练通常依赖高性能计算资源,高昂成本限制了普及应用。相比之下,低性能加速器供应更充足且单机成本更低。因此,Ling团队提出了不使用高级GPU来扩展模型的创新策略,旨在突破资源与预算限制。

具体而言,团队提出的创新策略包括动态参数分配与混合精度调度技术、自适应容错恢复系统、自动化评测框架以及基于知识图谱的指令微调等。这些策略的实施使得使用低规格硬件的训练成本降至约508万元,相比高性能硬件配置节省了近20%,同时实现了与顶尖模型相当的性能。

蚂蚁集团的这一技术成果不仅有助于降低AI训练成本,还为国产大模型寻找成本更低、效率更高的替代方案提供了可能。如果得到验证及推广,将进一步降低对英伟达芯片的依赖。

蚂蚁加码AI应用与人形机器人领域

蚂蚁集团自研的百灵大模型重点布局在生活服务、金融服务、医疗健康等场景的应用。去年5月,蚂蚁在开放日上展示了多个AI创新应用产品,并公布了AI应用矩阵。其中,基于蚂蚁百灵大模型的生活管家、就医助理及金融助手是当下重点破局方向。

此外,蚂蚁近期在人形机器人领域也动作频频。今年2月,蚂蚁集团开放招聘具身智能人形机器人系统和应用等岗位。去年12月,蚂蚁集团注册成立了上海蚂蚁灵波科技有限公司,聚焦具身智能技术和产品研发。据悉,蚂蚁灵波科技是蚂蚁集团拓展具身智能和机器人业务的主要载体,致力在家庭、养老、医疗健康等领域打造行业领先的机器人产品。

业内人士分析称,具身智能人形机器人为新兴领域,市场前景广阔。蚂蚁集团布局该领域,有助于探索新的增长点,并基于自身在人工智能、大数据、云计算等方面的技术优势和已有业务布局,加速人形机器人的研发和在相关业务场景中的应用。