Clear Sky Science · zh
使用机器学习算法评估行人碰撞责任程度
这为何关系到日常行人和驾驶者
过马路或在城里开车看似日常,但一旦发生事故,生活可能瞬间改变——随之而来的是关于责任归属的痛苦质疑。本研究考察了西班牙一座城市的行人事故,探讨现代计算工具是否能帮助警方和法官更公平、一致地分辨责任,利用真实事故数据中隐藏的模式。
将悲剧性事故转化为有用数据
研究人员收集了来自西班牙巴达霍斯的510起真实事故的详细信息,这些事故均已完成全部法律程序。对于每起事故,他们用五个类别记录了司机与行人之间最终的责任分配:从司机全责到责任均摊。与此同时,他们对每个案例编码了14个简单的是/否变量,分为四类:人为因素(如酒精、毒品、注意力、反应时间)、技术因素(车辆检验与行人服装可见性)、街道环境(位置与照明)及交通规则(驾照状态、车速与手机使用)。

教会计算机识别责任模式
基于该数据集,团队测试了若干机器学习方法——能从示例中学习模式的计算程序。他们比较了多种常见方法,并重点关注三种在此任务中表现最好的:决策树、朴素贝叶斯和支持向量机。每个模型用60%的事故数据进行训练,然后预测剩余40%的责任类别。为避免模型简单“记忆”数据,研究者采用了交叉验证技术,并对不常见的类别(例如责任恰好50%:50%)进行了平衡处理。
在让计算机判断前清理信号
更多信息并不总是更好。团队首先检查了14个变量中是否有实质上重复的信息。他们发现司机与行人的酒精和毒品使用是强相关的成对变量。从每对中仅保留一个变量后,变量列表缩减到12个独立因子。使用这个更精简的输入集训练的模型实际上表现更好:去除冗余信息降低了噪声,帮助算法更清晰地区分不同的责任等级。
哪种模型获胜,哪些因素真正重要
在多次测试中,决策树模型表现最佳。在简化至12个变量的情况下,其总体准确率约为78%,且在计算资源上比其他方法更快、更节省。决策树的另一个优势是它能直观显示哪些信息在最终判定中权重最大。在本研究中,影响力最大的因素远高于其他因素——约占决策权重的一半——是司机是否持有有效驾照。其次重要的因素包括行人所在位置(尤其是否在或靠近人行横道)、司机是否受酒精或毒品影响、以及司机是否被手机分心。行人的分心、服装可见性与照明也产生影响,但程度较小。

从法庭辅助到更安全的街道
某些情形对算法仍然难以判定,尤其是那些责任恰好在司机与行人之间平分的罕见案例。作者认为此类边缘情形仍应由人类专家仔细审查。即便如此,他们开发的工具可以为法官和交通警察提供客观、基于数据的“第二意见”,突出何时存在与过往裁决相匹配的模式,并让专业人员将精力集中在最复杂的案件上。同样重要的是,研究结果指出了明确的预防优先事项:加强驾照管理、打击酒驾与吸毒驾驶、限制驾驶时手机使用、以及在斑马线处保护行人。通俗地说,这项研究表明,更智能的计算工具与更安全的行为都能帮助更公平地判定责任——并从源头上减少陷入这些悲剧情形的人数。
引用: Moreno-Sanfélix, A., Gragera-Peña, F.C. & Jaramillo-Morán, M.A. Evaluation of the level of responsibility in pedestrian crashes using machine learning algorithms. Sci Rep 16, 12093 (2026). https://doi.org/10.1038/s41598-026-42875-4
关键词: 行人安全, 交通责任, 机器学习, 决策树, 道路碰撞