AI导读:

DeepSeek在“开源周”期间宣布开源Fire-Flyer文件系统(3FS)及基于3FS的数据处理框架Smallpond,展示了在技术创新上的持续努力。同时,还开源了多个项目,涵盖了MLA解码、MoE模型训练和推理等多个方面。DeepSeek的火热态势持续不减,有望打破全球AI行业的发展格局。

2月28日,在“开源周”的第五天,Deepseek宣布开源Fire-Flyer文件系统(3FS)及基于3FS的数据处理框架Smallpond。这一举措展示了DeepSeek在技术创新上的持续努力。

Fire-Flyer文件系统(3FS)是一款专为现代SSD和RDMA网络设计的并行文件系统,能够充分利用这些硬件的全部带宽,成为DeepSeek数据访问的加速器。其亮点包括:在180节点集群中,聚合读取吞吐量高达6.6TiB/s;在25节点集群的GraySort基准测试中,吞吐量达到3.66TiB/min;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。此外,3FS还具备强一致性语义的分解架构,支持V3/R1中的训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查询推理。

同时,Smallpond作为一款轻量级的数据处理框架,基于DuckDB的高性能数据处理可扩展性,能够轻松处理PB级别数据集,无需持续运行的服务,操作简便。

至此,DeepSeek为期五天的“开源周”活动圆满结束。自2月21日宣布将开源5个代码库以来,DeepSeek逐步兑现承诺,展现了其在AI领域的深厚积累和开放态度。

在此期间,DeepSeek还开源了FlashMLA、DeepEP、DeepGEMM及Optimized Parallelism Strategies等多个项目,涵盖了MLA解码、MoE模型训练和推理、密集布局和MoE布局支持以及大规模模型训练效率优化等多个方面。

DeepSeek的火热态势持续不减。据QuestMobile数据显示,自上线以来至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万个。此外,有消息称DeepSeek-R2模型正在加速开发,或将提前发布,引发业界广泛关注。

随着DeepSeek等企业在AI领域的不断探索和创新,全球AI行业的发展格局有望被打破,更多企业将迎来新的发展机遇。

(文章来源:中国基金报)