9月30日消息,中国大模型厂商智谱正式发布并开源新一代大模型GLM-4.6。在公开基准测试和真实编程任务中,智谱表示,GLM-4.6代码生成能力全面对齐ClaudeSonnet4,成为目前国内最强的Coding模型。同时,模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级。
作为开源模型,智谱官方宣布,GLM-4.6已在寒武纪国产AI芯片上实现FP8+Int4混合量化推理部署,这也是首次在国产芯片上投产的FP8+Int4模型-芯片一体化解决方案。与此同时,摩尔线程基于vLLM推理框架完成对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型。(广角观察)
评论 ( 0 )