Clear Sky Science · zh
无监督视觉学习在与任务无关的自然场景中显现,源于视觉区域注意抑制效应的减弱
大脑如何从我们所见中学习
每天我们的眼睛接收成千上万幅场景,从拥挤的街道到宁静的森林。我们并不刻意研究这些视野,但随着时间推移,我们的视觉会越来越适应周围的世界。本研究提出了一个简单却具有意外含义的问题:大脑是否会自动从所有可见影像中学习,还是只从某些影像中学习?注意力在这一隐蔽学习中是如何帮助或阻碍的?

无需努力的观察
研究者把注意力集中在一种称为视觉知觉学习的改进上,人们在这种学习中会变得更擅长判断基本视觉特征,例如线条方向或图案粗细。早期研究表明,此类学习通常需要反馈或集中注意力。但许多人类与机器学习被认为是无监督的,仅由重复暴露驱动。为检验这种被动学习是否会塑造视觉,研究团队向志愿者展示与他们执行任务无关的图像,随后测量他们判别细微视觉细节能力的变化。
自然场景与人工图案
参与者在屏幕中央执行一项要求很高的字母与数字任务,同时在背景中看到自然场景或精心设计的人工图像。自然场景看起来像森林、城市景观或其他真实世界视图,富含边缘、纹理与轮廓。人工图像则被构造为匹配自然场景的某些简单属性,例如整体亮度、线条方向与空间频率,但被打乱以去除有意义的结构。经过多日暴露后,研究者用中性测试图像检验人们分辨线条方向或图案粗细的能力。
大脑何时学习、何时不学习
结果令人惊讶。当图像仅被观看而没有任何中央任务时,自然与人工图像都提升了视觉敏感性,表明无监督学习在原则上是可行的。然而,当注意力被占用于要求很高的中央任务时,只有自然场景产生了持久的提升。即使在简单统计特性上匹配并清晰可见,人工图像并未带来任何改善。进一步的实验将图像分解为不同类型的统计结构。只要与任务无关的图像包含边缘与纹理之间的复杂高阶关系,就会出现学习;而当仅包含简单的低阶成分时,学习则消失。
注意力与隐含图像结构
为理解大脑内部发生了什么,团队将行为测试与脑成像结合。他们发现顶叶与额叶的注意系统无论图像类型如何,发出的抑制信号相似。然而,对于具有高阶结构的图像,初级视觉皮层以外的高级视觉区域的活动模式受到的抑制较少。额外的时间实验显示,大脑提取自然场景中这些复杂关系所需时间比处理简单图案更长。由于自上而下的抑制在有限时间窗口内会减弱,较慢的复杂信号可能在最强抑制过去后得以“溜过”并留下痕迹,从而使无监督学习得以发生。
这对日常视觉意味着什么
简而言之,该研究表明大脑始终处于可以在无需指导的情况下从所见中学习的状态,但这种学习受到过滤。当我们的注意力紧密集中于一项任务时,背景中的简单人工图案会被有效抑制,几乎不留下痕迹。自然场景由于其在边缘与纹理之间复杂的关系网络,更难以被完全压制,即便我们没有注意它们,也能改变我们的视觉。该工作指出,无监督学习是视觉改善的基本驱动力,其影响取决于我们所观看内容的隐含结构以及注意力如何通过视觉系统对信息加以门控。

引用: Watanabe, T., Sasaki, Y., Zama, T. et al. Unsupervised visual learning is revealed for task-irrelevant natural scenes due to reduced attentional suppression effects in visual areas. Nat Commun 17, 4232 (2026). https://doi.org/10.1038/s41467-026-72918-3
关键词: 视觉学习, 自然场景, 注意力, 知觉学习, fMRI