DeepSeek开源周收官,发布多项创新技术
AI导读:
DeepSeek在“开源周”期间宣布开源Fire-Flyer文件系统(3FS)及基于3FS的数据处理框架Smallpond,展示了在技术创新上的持续努力。同时,还开源了多个项目,涵盖了MLA解码、MoE模型训练和推理等多个方面。DeepSeek的火热态势持续不减,有望打破全球AI行业的发展格局。
2月28日,在“开源周”的第五天,Deepseek宣布开源Fire-Flyer文件系统(3FS)及基于3FS的数据处理框架Smallpond。这一举措展示了DeepSeek在技术创新上的持续努力。
Fire-Flyer文件系统(3FS)是一款专为现代SSD和RDMA网络设计的并行文件系统,能够充分利用这些硬件的全部带宽,成为DeepSeek数据访问的加速器。其亮点包括:在180节点集群中,聚合读取吞吐量高达6.6TiB/s;在25节点集群的GraySort基准测试中,吞吐量达到3.66TiB/min;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。此外,3FS还具备强一致性语义的分解架构,支持V3/R1中的训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查询推理。
同时,Smallpond作为一款轻量级的数据处理框架,基于DuckDB的高性能数据处理可扩展性,能够轻松处理PB级别数据集,无需持续运行的服务,操作简便。

至此,DeepSeek为期五天的“开源周”活动圆满结束。自2月21日宣布将开源5个代码库以来,DeepSeek逐步兑现承诺,展现了其在AI领域的深厚积累和开放态度。
在此期间,DeepSeek还开源了FlashMLA、DeepEP、DeepGEMM及Optimized Parallelism Strategies等多个项目,涵盖了MLA解码、MoE模型训练和推理、密集布局和MoE布局支持以及大规模模型训练效率优化等多个方面。
DeepSeek的火热态势持续不减。据QuestMobile数据显示,自上线以来至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万个。此外,有消息称DeepSeek-R2模型正在加速开发,或将提前发布,引发业界广泛关注。
随着DeepSeek等企业在AI领域的不断探索和创新,全球AI行业的发展格局有望被打破,更多企业将迎来新的发展机遇。
(文章来源:中国基金报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。