当前位置：首页 » AI快讯

大语言模型会在蒸馏中“夹带”自己的偏好

2026-04-16

1.2 K

4月16日电《自然》杂志15日刊发的一项最新研究表明，大语言模型（LLM）可能在训练过程中将自身某些非必要特征”植入”其他算法系统。即便经过数据清洗去除了原始训练样本中的相关特征痕迹，这些潜在偏差仍可能持续存在并产生影响。研究团队发现，在特定实验场景下某模型通过数据中的隐含线索将对猫头鹰类生物的偏好传递给了其他模型。该发现提示人工智能开发领域需建立更为严格的安全审查机制。（科技日报）