Clear Sky Science · zh
通过视觉脑机接口进行的共生式大脑-机器绘画
用你的思维绘画
想象一下在不动一根肌肉的情况下画出一幅图——不用鼠标,不用触控笔,甚至不需移动眼睛——只是通过想象你想画的形状。这项研究展示了一个早期但可行的版本:一个简单、低成本的系统,使人们通过将大脑活动与自适应计算程序配合,“用心绘”基本形状和数字。

大脑信号如何与屏幕交流
研究人员使用带有三个电极的基础头带构建了一个无创脑-机接口(BCI),其中一个电极位于视觉皮层区域。在电脑屏幕上,十个白色圆盘在深色背景上以略有不同的频率闪烁。受试者静静地想象一个简单形状——例如字母、几何图形或手写数字——并被要求注视与该想象形状重叠最好的闪烁圆盘。由于每个圆盘以独特的节律闪烁,头带可以检测到大脑对该节律的电反应。通过分析这些“稳态视觉诱发电位”(SSVEP),系统能判断受试者正在关注哪个圆盘,并将该圆盘视为心理绘图的一小部分。
一步步构建图像
图像不会一次性出现。相反,该过程以持续数秒的短回合运行。在每个回合中,被试选择与其想象对象重叠最佳的圆盘。系统记录大脑反应的强度并为该圆盘分配权重。经过约25个此类回合后,这些加权的圆盘位置像画布上的点一样叠加在一起,形成图像。一个巧妙的“策略”随后决定下一组圆盘的位置,将采样精力集中在屏幕上最有希望的区域。该策略的一种版本受早期视觉系统检测边缘和纹理方式的启发;另一种更快的版本则使用从成千上万手写数字中学得的机器构建块。在两种情况下,计算机都会根据不断生成的绘图进行自适应,逐步逼近用户意图。

思维绘画效果如何?
八名志愿者使用该系统的基础版本各自绘制了三种简单形状。研究团队将脑绘结果与手绘目标图像进行比较,发现平均而言匹配良好:重建的形状捕捉到了所意图字母和符号的主要结构,即便并非像素级完美。研究人员随后使用信息论估计该过程每秒传递的可用信息量。自适应思维绘画大约达到1.3比特每秒——已经高于在相同硬件下标准单向BCI预计能达到的速率。当启用针对数字的基于数据的策略时,信息速率跃升到超过4比特每秒,但代价是仅限于与训练数据中形状相似的图形。
从粗略草图到丰富图像
为探讨这种粗糙的脑引导草图可用于何种用途,团队将它们与现代图像生成器(Stable Diffusion)结合。系统首先生成粗略的思维绘图,然后将其与文本描述一起送入图像生成器,由其填充细节和风格。对于“机器人”“树”“灯”或“飞机”等提示,在相同提示下的两次不同思维绘画会话生成了不同但可识别相关的最终图像。这表明简单的神经草图有朝一日可以为交流或创作提供丰富、个性化的图形种子,而细节的重任则由人工智能来承担,而非仅靠脑接口完成。
为何重要以及下一步是什么
这项工作表明,仅凭一个廉价的大脑传感器和巧妙的反馈驱动设计,人们就能在大约两分钟内引导计算机重建基本的想象形状,有时对数字来说甚至不到一分钟。关键进展不仅在于解码大脑信号,而在于创造一种真正的伙伴关系:计算机反复细化其猜测,人则简单地选择最佳匹配。尽管目前仍局限于简单形状并依赖闪烁探测,这种方法预示了未来可为无法言语或活动不便的人提供工具,也为希望以思维速度进行视觉头脑风暴的艺术家或设计师提供可能。
引用: Wang, G., Huang, Y., Muckli, L. et al. Symbiotic brain-machine drawing via visual brain-computer interfaces. npj Biomed. Innov. 3, 31 (2026). https://doi.org/10.1038/s44385-026-00086-6
关键词: 脑-机接口, 思维绘画, 脑电图(EEG), 视觉想象, 辅助交流