4月7日最新消息显示,中国电信携手阿里云打造的粤港澳大湾区首个”真武”万卡级智能计算集群日前在韶关数据中心正式启用。作为国家”超大规模智算集群”新基建工程在大湾区落地的首个标杆项目,该集群实现了从底层芯片、云计算平台到上层模型应用的全链条自主研发体系构建,在国产算力领域完成了从核心技术突破到规模产业化应用的关键跨越。
在技术创新层面,该计算集群突破性地实现了多项关键技术指标:通过采用卡间RoCE高性能组网架构与双平面多轨通信技术方案,成功将端到端网络时延压缩至4微秒级别,并使网络峰值利用率突破95%效能阈值。这种创新架构可高效支撑大模型训练中涉及的AllReduce、AlltoAll等超大规模数据通信需求,在实际应用中能够稳定承载千亿参数量级超大规模模型的预训练及推理任务。值得关注的是,搭载的真武芯片组不仅提供单机1.5TB超大显存容量支撑,在卡间互联带宽方面更达到每秒700GB以上的传输速率(广角观察)。
©版权声明:如无特殊说明,本站所有内容均为Amassai.net 原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。
未经允许不得转载:AI人工智能资源一站式平台|AmassAI先驱探索品牌站 » 粤港澳大湾区首个“真武”万卡智算集群上线




















评论 ( 0 )