腾讯混元大模型团队于11月21日正式对外发布并开源轻量化视频生成模型HunyuanVideo 1.5。该模型采用Diffusion Transformer架构设计,仅搭载83亿参数规模即可实现功能突破:支持生成5至10秒时长的480p/720p高清视频片段,并可通过超分辨率技术提升至1080p画质。其技术创新主要体现在两点:首创SSTA稀疏注意力机制与多阶段训练策略的结合应用,在视频帧间运动连贯性、语义一致性等关键指标上达到商用标准。硬件适配方面实现重大突破——仅需配备14GB显存的消费级显卡即可流畅运行推理任务(同类开源方案普遍要求50GB以上显存)。
目前该技术已落地腾讯元宝APP产品端:用户可通过文字描述或上传图片结合提示词生成视频内容,并支持中英文双语输入、写实/动画多风格切换以及运镜控制、文本指令生成等进阶功能。开发者社区同步开放访问权限:模型代码已托管至Hugging Face和GitHub平台供免费下载试用。(广角观察)
©版权声明:如无特殊说明,本站所有内容均为Amassai.net 原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。

















评论 ( 0 )