11月27日最新消息显示,DeepSeek公司正式发布专精数学推理的新一代模型DeepSeekMath-V2。该模型采用自主研发的自验证训练框架构建,在基础版本DeepSeek-V3.2-Exp-Base之上进行技术迭代。通过内置的LLM验证器对生成的数学证明进行自动化审查,并结合高难度样本持续强化系统性能。在国际数学奥林匹克竞赛(IMO)2025、中国数学奥林匹克竞赛(CMO)2024中均达到金牌选手水平,在普特南数学竞赛(Putnam)2024中更以118分(满分120分)的优异成绩脱颖而出。研究团队指出,这项成果不仅验证了自验证推理路径的有效性,更为构建可靠的人工智能数学系统开辟了全新技术方向。目前项目团队已将该模型的完整代码及预训练权重公开发布于Hugging Face与GitHub平台。(广角观察)




















评论 ( 0 )