3月30日,阿里云正式推出全新全模态大模型Qwen3.5-Omni。该系列包含Plus、Flash、Light三款不同规格的指令微调版本,支持长达256k的超长上下文交互功能。在多模态处理能力方面,单次可处理超过10小时的音频文件,并最高支持400秒720P分辨率(1帧/秒)的音视频内容输入。此外该模型具备跨语言处理优势:覆盖113种语言及方言的语音识别能力,并支持36种语言及方言的语音合成技术。开发者目前可通过Offline API离线接口或Realtime API实时接口进行体验。(广角观察)




















评论 ( 0 )