Deepseek面世,悄然改变银行业金融大模型研发策略
AI导读:
AI大模型Deepseek的问世,正逐步改变着银行业的金融大模型研发与应用策略。文章介绍了Deepseek在银行业的应用前景,包括其在降低数据训练成本、提高投入产出比等方面的优势,以及中小银行基于其自研金融大模型的计划。同时,探讨了AI Agent在银行业务场景中的应用与挑战。
AI大模型Deepseek的问世,正逐步改变着银行业的金融大模型研发与应用策略。2025年2月5日,据多位银行IT部门人士透露,他们已开始对Deepseek进行初步测试,旨在观察其在智能客服、内部办公等金融场景中的降本增效效果,以期找到相较于其他大模型的独特优势。
一位股份行IT部门负责人表示,银行在探索大模型金融应用方面已有多番尝试,包括自研金融大模型和基于通用大模型研发金融小模型。然而,这些尝试均伴随着高昂的成本。Deepseek以其较低的数据训练成本,为银行在金融大模型研发应用方面提供了提高投入产出比的新希望。
春节期间,某城商行IT团队也讨论了基于Deepseek开源大模型研发自身金融大模型的计划。对于中小银行而言,Deepseek的低成本数据训练特性成为了自研金融大模型的新突破口。若Deepseek在数据训练成本、内容准确性及投入产出比等方面表现出色,这些银行将重点围绕其研发金融大模型。
Deepseek的面世,不仅为中小银行提供了自研金融大模型的新机遇,还有望缩小其与大型银行在金融大模型应用方面的差距。上海交通大学上海高级金融学院副院长李峰指出,AI大模型能否推动金融行业高质量发展,关键在于其能否为金融机构带来实质性的降本增效。
近年来,AI大模型在银行业务场景中的应用日益广泛,包括普惠金融、风控、客户营销、支付等各个环节。Deepseek的出现,将进一步推动银行在AI Agent等前沿技术的研发应用,助力银行提升运营效率与风险识别能力。
然而,银行在拥抱AI大模型的同时,也面临着投入产出比的挑战。李峰透露,AI大模型的研发成本极高,数据训练费用可达千万美元级别。因此,中小金融机构往往选择成本更低的研发路径,如与外部大模型服务商合作、多家机构合作研发或依托行业性公共平台等。
Deepseek以其较低的算力投入与数据训练成本,有望成为银行自研金融大模型的新选择。若其能显著降低银行研发成本,并产生与其他大模型相当的AI生成式内容效果,将对银行大模型应用产生深远影响。一是中小银行将能以更低成本自研金融大模型,缩小与大型银行的差距;二是银行将更加倾向于自研金融大模型,减少对外部通用大模型的依赖;三是基于Deepseek的开源特性,银行大模型研发团队有望结合业务特点与创新需求,自研更契合自身需求的专属金融大模型。
此外,随着AI大模型在银行业务场景中的广泛应用,金融机构对大模型能力的要求也在不断提升。清华大学金融科技研究院副院长薛正华表示,金融机构对大模型在金融信息分类、抽取、计算、逻辑推理等方面的能力需求日益增加。针对严苛的金融业务合规操作要求,采用MoE混合专家模型或许是一条有效的金融大模型发展路径。
Deepseek通过算法优化,在较低算力下充分调动混合专家MoE模型架构与AI深度学习能力,为银行研发金融大模型提供了新方向。目前,已有银行内部发起工作组,对Deepseek进行复刻、数据训练与金融场景应用测试,以期验证其降本增效效果。
随着AI技术的不断迭代升级,AI Agent在银行业务场景中的应用也日益增多。然而,算力瓶颈仍是制约中小银行布局AI Agent技术的一大挑战。Deepseek的算力消耗要求与数据训练成本较低,为银行解决AI Agent研发应用中的算力问题提供了新思路。
尽管Deepseek有助于降低银行研发AI Agent的算力束缚,但AI Agent能否快速应用在银行部分业务场景仍存变数。金融机构在使用AI Agent时仍需高度关注合规操作风险。随着AI Agent技术的日益成熟和数据加密技术的持续进步,将AI Agent应用在部分金融业务场景将成为一种趋势。
(文章来源:每日经济新闻,图片来源:网络)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。