AI导读:

腾讯推出自研深度思考模型混元T1正式版,该模型具有效果好、速度快的特点,多项指标达业界领先水平。混元T1采用混合Mamba架构,显著降低训练和推理成本,已在腾讯云官网上线。腾讯在大模型业务上动作频频,加大AI相关投资和研发力度。


继快思考模型Turbo S后,腾讯推出了自研深度思考模型混元T1正式版,这是一款“能秒回”的强推理模型,首次在工业界将混合Mamba架构无损应用于超大型推理模型,标志着AI技术的又一重大突破。

3月21日深夜,腾讯混元大模型团队推出了自研深度思考模型混元T1正式版。该模型凭借效果好、速度快的特点,在多项指标上达到业界领先的推理水平,吐字速度达到每秒60—80tokens,在实际生成效果表现中远超Deepseek-R1推理模型。

混元T1正式版致力于解决当前推理模型响应速度慢的问题,不仅吐字快、能秒回,还擅长超长文处理。在常见基准测试上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,超越了DeepSeek-R1,仅次于o1。

值得注意的是,混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本。

这意味着腾讯摒弃了传统及主流的纯Transformer架构,在AI技术领域迈出了重要一步。

目前,混元T1已在腾讯云官网上线,价格亲民,输入价格为1元/每百万tokens,输出价格为4元/每百万tokens,仅为DeepSeek标准时段的1/4。

腾讯在大模型业务上动作频频,作为后发者,今年以来不仅快速将旗下十余款产品接入DeepSeek,自研的混元模型系列也进入快速迭代期。同时,腾讯加大对C端产品元宝的投入,积极抢占大模型用户入口。

腾讯最新财报显示,2024年全年实现营收6603亿元,同比增长8%;净利润为1940.7亿元,比上年增长68%。马化腾表示,AI发展迅猛,腾讯在云业务、“元宝”(AI应用)上积极拥抱DeepSeek和混元模型。

自今年2月以来,腾讯元宝接入DeepSeek满血版和全新混元模型,双核驱动元宝高速进化,35天内版本已更新30次。目前,腾讯已有数十款产品及业务接入DeepSeek。

业内人士分析,腾讯通过结合混元模型与DeepSeek模型,致力于在AI应用领域构建竞争优势。

马化腾还表示,腾讯重组了AI团队,聚焦产品创新及模型研发,增加AI相关资本开支,加大原生AI产品研发和营销力度。预计这些投资将通过提升广告业务效率及游戏生命周期带来持续回报。

财报显示,2024年第四季度,腾讯资本开支同比增长386%至365.8亿元,全年资本开支达到767.6亿元,同比增长221%。AI研发投入方面,2024年全年达到706.9亿元,2018年至今累计投入3403亿元。

(文章来源:券商中国)