6月4日消息,广东智动未来联合上海创智学院蔡盼盼教授团队发布MINT-4B多模态VLA(视觉-语言-动作)大模型。该模型凭借突破性泛化能力与实机表现,在英伟达等行业巨头及国际权威专家发布的全球主流通用机器人大模型评测中跻身前三甲,技术指标优于OpenVLA、GR00T、π、UniVLA等标杆模型。
MINT系列核心创新为“复刻任务意图而非机械复刻轨迹”,独创SDAT多尺度频域分词技术,拆分顶层任务意图与底层执行细节两类特征,依托跨尺度自回归推理实现分层解码,解决传统VLA模型环境适应性差的痛点。目前该技术已搭载于小智S2人形机器人,覆盖科教研学、商业展厅等场景,配套开发、实训一体化方案降低落地成本,机型已在全国多地商用落地。(广角观察)

















评论 ( 0 )