据1月21日报道,DeepSeek公司计划于今年2月中旬正式推出新一代旗舰AI模型DeepSeek V4。该模型将采用全新技术架构,在代码生成能力方面预计将迎来大幅提升。通过分析DeepSeek官方GitHub仓库近期更新的FlashMLA代码文件(共计114个文件涵盖.py、.md、.txt、.sh、.cpp、.cu和.h格式),研究人员发现了一个此前未公开的核心模型标识符”MODEL1″——该标识在代码中被引用达31次之多。
作为DeepSeek自主研发的技术结晶,FlashMLA是专为英伟达Hopper架构GPU深度优化的软件工具链系统,其核心功能聚焦于加速大模型推理生成过程。值得关注的是,在该工具支持的核心模型架构体系中,除了已知的DeepSeek-V3.2版本外,新出现的MODEL1架构同样占据重要地位。(广角观察)
©版权声明:如无特殊说明,本站所有内容均为Amassai.net 原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。






















评论 ( 0 )