Clear Sky Science · zh

使用多元 ARMAX 与 NLARX 模型对土耳其职业事故进行预测

· 返回目录

为何预测工作场所事故很重要

在土耳其,每年有数十万名工人在工作场所受伤,并有数千人因事故丧生。对于政府、雇主和工会而言,了解未来几年事故是可能上升还是下降,对于安排检查、培训和安全投入至关重要。本研究提出一个简单但重要的问题:我们能否利用过去的事故统计可靠地预测未来事故?如果可以,哪类数学模型最为有效?

细看土耳其的事故记录

作者利用土耳其社会保障机构的官方月度数据,时间覆盖自 2013 年(当年一项新的职业健康与安全法生效)至 2023 年末。为使情况更清晰,他们将劳动力分为四组:未发生事故的参保人员、轻微事故者、重伤事故者以及致命事故者。把这些群体放在一起观察可以看出事故模式并非孤立。例如,轻微事故的变化可能会影响严重伤害和死亡,尤其是在建筑、采矿和运输等高风险行业。研究团队的目标是用能够从过去学习并将这些相互交织的趋势投射到未来的模型来捕捉这些趋势。

Figure 1
Figure 1.

从单一曲线到相互关联的时间线

许多早期研究依赖逐条独立预测,把每种事故类型视为各自独立演化。在本研究中,研究者采用多元时间序列方法,允许四个群体随时间互相影响。他们测试了两类模型。第一类技术上称为 ARMAX,是线性模型:它假定未来值可以表示为过去值和随机噪声的加权组合。第二类称为 NLARX,加入了诸如平方项和交互项等非线性成分,从而允许更复杂的响应。由于缺乏合适的月度宏观经济和行业数据,两类模型均仅关注事故统计本身的内部动态,而没有加入失业率或产量等外部驱动因素。

模型的构建与评估方式

作者使用专门的系统辨识工具将事故记录转换为结构化数据集,并将其分为训练部分(前 80 个月)和测试部分(之后的 52 个月)。然后他们在训练数据上拟合线性与非线性模型,并让每个模型对测试期进行预测。准确性使用归一化均方误差评分来衡量,该评分比较所有月份和四个群体中预测曲线与观测曲线之间的差距。通过扫描许多可能的模型结构并仅保留在统计上有意义的参数,他们降低了仅记忆历史数据的过度复杂公式的风险。这一谨慎程序使他们能够比较线性与非线性方法在训练数据之外的泛化能力。

Figure 2
Figure 2.

预测结果揭示了什么

结果呈现出明确的模式。总体而言,线性 ARMAX 模型对历史数据拟合非常准确,并在四个群体上都表现出较低的预测误差。它在未发生事故的参保人员和轻微事故组上表现尤为出色,预测曲线在超过四年的测试期内与真实数据紧密跟踪。非线性 NLARX 模型在未发生事故的群体表现稍优于线性方法,并且在轻微事故和致命事故上与线性模型表现相当。然而,其对重伤事故的预测明显不够稳定,随着预测期延长偏差增大。对线性模型参数的进一步观察表明,轻微事故和无事故人群受许多温和但显著影响因素的共同作用,而重伤事故和致命事故则由少数强有力的主导因素驱动。

对安全政策的意义

对非专业读者而言,结论是:相对简单且设计良好的线性模型就能为土耳其不同类别的职业事故未来走向提供可靠的预警。由于这些模型明确追踪轻微、重伤和致命事故随时间的联动,它们可以帮助决策者在更危险类别的问题初现端倪时及早发现并采取行动,防止死亡率激增。非线性模型在某些稳定群体上有附加价值,但在影响最大的领域——预测重伤和致命事故方面尚未持续优于线性方法。研究表明,主管部门可以自信地使用多元线性预测来指导有针对性的检查、在高风险行业加强执法以及更合理地分配培训与预防资源;而今后若能纳入更丰富的行业和工作条件数据,可能会进一步提升这些预测工具的精度。

引用: Kaplanvural, S., Tosyalı, E. & Ekmekçi, İ. Forecasting occupational accidents in Turkey using multivariate ARMAX and NLARX models. Sci Rep 16, 5696 (2026). https://doi.org/10.1038/s41598-026-36210-0

关键词: 职业事故, 时间序列预测, 工作场所安全, 土耳其, 统计建模