AI导读:

DeepSeek在“开源周”最后一天宣布开源Fire-Flyer文件系统(3FS)及数据处理框架Smallpond,展示技术创新实力。此前已陆续开源多个项目,累计下载量超1.1亿次。DeepSeek-R2模型加速开发,或提前发布,将打破行业垄断格局。

2月28日,在“开源周”的第五天,Deepseek公司宣布开源Fire-Flyer文件系统(3FS)及基于3FS的数据处理框架Smallpond。这一举措展示了DeepSeek在技术创新上的持续投入。

Fire-Flyer文件系统(3FS)充分利用现代SSD和RDMA网络,实现了高带宽的并行文件处理能力,成为DeepSeek数据访问的加速器。其特点包括:在180节点集群中,聚合读取吞吐量高达6.6TiB/s;在25节点集群中,GraySort基准测试吞吐量达3.66TiB/min;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。此外,3FS具有强一致性语义的分解架构,适用于V3/R1中的训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查询推理。

Smallpond则是一个轻量级的数据处理框架,基于DuckDB的高性能数据处理能力,能够处理PB级别数据集,无需持续运行的服务,且操作简便。

随着这次开源,DeepSeek为期五天的“开源周”活动圆满结束。此前,DeepSeek已陆续开源了FlashMLA、DeepEP、DeepGEMM和Optimized Parallelism Strategies等多个项目,涵盖了MLA解码、MoE模型训练和推理、密集布局和MoE布局支持以及大规模模型训练效率优化等多个领域。

DeepSeek的火热程度不言而喻。据统计,自上线以来至2月9日,DeepSeek App的累计下载量已超过1.1亿次,周活跃用户规模最高近9700万个。此外,有消息称DeepSeek-R2模型正在加速开发,或将提前发布,新模型有望生成更高质量的代码,并支持多种语言推理。

DeepSeek的创新成果引起了业界的广泛关注。印度科技服务商Zensar的首席运营官认为,DeepSeek-R2模型的发布或将成为AI行业的关键时刻,将促使全球公司加速研发进程,打破目前少数企业垄断的格局。目前,国内外多家科技巨头已相继推出深度推理/深度思考模型,AI行业竞争日益激烈。

(文章来源:中国基金报,关键词:DeepSeek、AI模型、技术创新、行业竞争)