4月2日消息,北京中关村学院信息智能团队自主研发的智能体系统Milkyway,在国际权威评测FutureX中以60.9分的成绩荣登全球榜首。该评测体系由字节跳动、斯坦福大学、复旦大学、普林斯顿大学等顶级学术机构联合发起,聚焦检验人工智能系统的”未来预测能力”。其独创的数据集通过HuggingFace平台公开发布,采用尚未发生的现实事件(如国际局势演变、政策调控方向、经济波动预测)作为测试样本。
值得关注的是,在本次动态评估中,埃隆·马斯克旗下xAI团队研发的Grok4系统仅获25.9分,Milkyway得分超过其两倍以上。该突破性成果由该校”AI核心”学部大模型方向郑书新副教授带领团队完成,在保持模型基础能力领先的同时,在智能体系统架构(harness层)实现关键创新:通过构建具备跨周期持续学习、多智能体协同作业及自主评估迭代的核心机制,使系统能够有效应对复杂现实场景中的动态挑战。(广角观察)





















评论 ( 0 )