积聚AI-更专业的AI工具、教程、新闻平台
当前位置:首页 » AI快讯

DeepSeek AI新模型:搭载 MODEL1 全新架构,最快2月上线

2026-01-22 1.2 K

据1月21日报道,DeepSeek公司计划于今年2月中旬正式推出新一代旗舰AI模型DeepSeek V4。该模型将采用全新技术架构,在代码生成能力方面预计将迎来大幅提升。通过分析DeepSeek官方GitHub仓库近期更新的FlashMLA代码文件(共计114个文件涵盖.py、.md、.txt、.sh、.cpp、.cu和.h格式),研究人员发现了一个此前未公开的核心模型标识符”MODEL1″——该标识在代码中被引用达31次之多。

作为DeepSeek自主研发的技术结晶,FlashMLA是专为英伟达Hopper架构GPU深度优化的软件工具链系统,其核心功能聚焦于加速大模型推理生成过程。值得关注的是,在该工具支持的核心模型架构体系中,除了已知的DeepSeek-V3.2版本外,新出现的MODEL1架构同样占据重要地位。(广角观察)

©版权声明:如无特殊说明,本站所有内容均为Amassai.net 原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。

评论 ( 0 )

contact

商务微信

qrcode

商务QQ:944844479

回顶部