蚂蚁集团自研大模型,推动AI技术普惠化
AI导读:
蚂蚁集团使用国产AI芯片训练大模型,推出百灵轻量版与增强版,实现低性能硬件高效训练,降低成本近20%。同时,蚂蚁加码AI应用与人形机器人领域,探索新的增长点。
蚂蚁集团使用国产AI芯片训练大模型,这一创新举措有望进一步降低AI训练成本,提升效率。近日,蚂蚁集团Ling团队发表了一篇技术成果论文,详细介绍了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus)。其中,Ling-Lite参数规模为168亿,Ling-Plus基座模型参数规模高达2900亿,两者性能均达到行业领先水平。
除了自研性能领先的大模型,蚂蚁集团此次技术论文的最大突破在于提出了一系列创新方法,旨在提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片的同规模模型相当。这一成果对于推动AI技术向普惠化方向发展具有重要意义。
蚂蚁集团自研大模型实现低性能硬件高效训练
蚂蚁集团Ling团队的技术成果论文已发表在预印版Arxiv平台上。论文指出,虽然Deepseek、阿里通义千问等MoE大模型在特定任务中展现出卓越性能,但其训练通常依赖高性能计算资源,高昂成本限制了普及应用。相比之下,低性能加速器供应更充足且单机成本更低。因此,Ling团队提出了不使用高级GPU来扩展模型的创新策略,旨在突破资源与预算限制。
具体而言,团队提出的创新策略包括动态参数分配与混合精度调度技术、自适应容错恢复系统、自动化评测框架以及基于知识图谱的指令微调等。这些策略的实施使得使用低规格硬件的训练成本降至约508万元,相比高性能硬件配置节省了近20%,同时实现了与顶尖模型相当的性能。
蚂蚁集团的这一技术成果不仅有助于降低AI训练成本,还为国产大模型寻找成本更低、效率更高的替代方案提供了可能。如果得到验证及推广,将进一步降低对英伟达芯片的依赖。
蚂蚁加码AI应用与人形机器人领域
蚂蚁集团自研的百灵大模型重点布局在生活服务、金融服务、医疗健康等场景的应用。去年5月,蚂蚁在开放日上展示了多个AI创新应用产品,并公布了AI应用矩阵。其中,基于蚂蚁百灵大模型的生活管家、就医助理及金融助手是当下重点破局方向。
此外,蚂蚁近期在人形机器人领域也动作频频。今年2月,蚂蚁集团开放招聘具身智能人形机器人系统和应用等岗位。去年12月,蚂蚁集团注册成立了上海蚂蚁灵波科技有限公司,聚焦具身智能技术和产品研发。据悉,蚂蚁灵波科技是蚂蚁集团拓展具身智能和机器人业务的主要载体,致力在家庭、养老、医疗健康等领域打造行业领先的机器人产品。
业内人士分析称,具身智能人形机器人为新兴领域,市场前景广阔。蚂蚁集团布局该领域,有助于探索新的增长点,并基于自身在人工智能、大数据、云计算等方面的技术优势和已有业务布局,加速人形机器人的研发和在相关业务场景中的应用。

郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。