Clear Sky Science · zh
一种整合计算美学与认知心理学的 AI 生成艺术评估模型
为什么评价 AI 创作的艺术很重要
随着 AI 系统在屏幕上大量呈现绘画、照片和设计作品,我们对人们如何判断这些机器创作的作品是否美、以及计算机如何有意义地承担这项任务,仍未完全理解。本研究搭建了心理学关于人们如何回应艺术的观念与 AI 模型对图像打分方式之间的桥梁,目的是让自动化的艺术评分更符合人类体验并更易理解。
将人类感受与机器评分连接起来
现有的大多数图像评分系统把美视为一个黑箱数值。相反,这项工作从心理学中的知名观点出发:人们偏爱易于处理、有清晰结构、并在熟悉与新颖之间取得平衡的图像。作者把这些想法转化为逐步的 AI 模型,模拟观者如何从原始视觉信息走向对图像的整体感受。该设计结合了基本的视觉组织、衡量图像解读难度的指标,以及用于快速或缓慢做出判断的两条不同路径。 
新评估模型的内部工作原理
模型首先将每幅图像组织为有意义的区域,呼应我们眼睛区分主体与背景并注意相似性、分组和完整形状的方式。然后通过结合视觉混乱度、与典型令人愉悦图案的熟悉度以及新颖性程度来估计图像的易处理性,参数设置使得适度的惊喜比无聊或困惑更受青睐。在此基础上,模型同时运行两条通路:一条快速通路在极短时间内捕捉整体外观与情绪,另一条较慢的通路更仔细地检查局部细节、纹理与内容,随后将所有信息融合为最终的审美得分。
通过人群测试模型
为了检验这些计算是否真正符合人类体验,研究招募了 120 名具有不同艺术专业水平的志愿者。他们观看了由人类创作与 AI 生成的、从简洁到视觉密集不等的艺术作品,评定喜欢程度,并完成描述每次观看心理负荷的问卷。眼动追踪记录了他们在每幅图像上注视的位置与时长,额外的口头报告捕捉了他们如何思考自己的选择。反应时间、注视模式与自我报告的丰富组合,使得模型内在运算与人们实际观看行为之间能够进行直接比较。 
比较揭示了什么
AI 的评分与人类判断表现出高度一致,接近不同人之间通常看到的一致水平。对于结构清晰、基本视觉分组规则明显的图像,其预测尤其吻合。模型还能成功追踪心理负荷,准确预测哪些图像在处理上会感到更费力,尤其是在心理负担和身体劳累等测量上。模型的注意力图生成的眼动模式类似人类的扫视路径:两者都更关注视觉和审美上重要的区域,且快速与缓慢观看阶段的时间安排呼应了两条通路的设计。然而研究也发现,文化背景、个人联想与艺术训练解释了许多剩余的不匹配,提醒我们美感从未完全普遍化。
这对我们与 AI 艺术的互动意味着什么
对普通读者来说,核心信息是可以构建出我们能够理解而非盲目信任的图像评判 AI 系统。通过将模型的各个部分植根于关于注意力、认知负荷、偏好与情感的心理学观点,这项研究表明 AI 可以帮助解释我们如何体验艺术,尽管我们的反应会受到文化和个人历史的塑造。在实际层面上,该框架可以指导推荐引擎、数字学习工具和画廊展示,使其尊重人类的限制与品味。与此同时,这项工作强调 AI 应当补充而非取代人类的审美判断,作为观察我们心智的透镜,而不是关于何为美的最终权威。
引用: Jin, C. An AI-generated art evaluation model that integrates computational aesthetics and cognitive psychology. Sci Rep 16, 15309 (2026). https://doi.org/10.1038/s41598-026-42766-8
关键词: AI 艺术, 审美判断, 认知心理学, 眼动追踪, 图像评估