Clear Sky Science · zh
在记录值下的应力-强度模型可靠性分析及实践验证
为什么破纪录对日常可靠性很重要
从飞机零件和运动表现到城市空气污染,我们不断问同一个问题:一个系统经受得住施加在它上的需求的可能性有多大?统计学家用“应力–强度”可靠性来描述这个问题:零件强度大于其承受的应力的概率。本文在以罕见极端事件主导的情形下,提出了新的工具来估计这一概率,且仅利用最极端的观测值——破纪录值——而非所有数据点。

在现实世界中比较应力与强度
在应力–强度的可靠性视角中,“应力”表示系统所经受的负荷——例如机翼受到的气流扰动或空气污染的激增——而“强度”表示系统应对这些负荷的能力。关键量是强度超过应力的概率。许多现代数据集,尤其是涉及极值的那类,表现出长尾特性:大部分值较小,但少数极大。作者用一种灵活的长尾分布——倒置指数帕累托分布(inverted exponentiated Pareto)来对应力和强度建模。这一选择便于捕捉驱动失效的罕见但重要的极端值。
充分利用破纪录观测
研究并不使用每一个观测值,而集中在上行记录值:一系列测量中的新高点。这些值在气候记录、金融或体育等领域是自然的摘要——新“纪录”往往受到关注,有时也是唯一被保存的信息。作者首先推导出一个只依赖于描述应力和强度分布的两个形状参数的简单可靠性公式。随后他们利用针对记录数据的极大似然方法构建这些参数的“古典”估计,并由此得到强度超过应力的概率估计及其近似误差范围。

融合古典与贝叶斯的不确定性观
除了古典估计外,文章还发展了一类贝叶斯方法,显式地将数据与关于未知参数的先验信念相结合。作者考虑了非信息先验(表示先验知识很少)和信息先验(反映先前经验),并通过若干“损失函数”探索不同的过度估计与低估的惩罚方式,包括平衡的平方误差损失和两种将单方向错误视为更昂贵的不对称替代方案。由于所得数学形式较为复杂,他们依赖马尔可夫链蒙特卡洛算法——Gibbs抽样与Metropolis–Hastings——从潜在概率模型中模拟,从而近似所需的可靠性估计与可信区间。
通过模拟与真实数据检验方法
为评估这些方法的性能,作者进行了大量计算实验。他们在已知条件下生成人工记录数据集,然后比较不同方法接近真实可靠性的程度。他们不仅考察平均准确性,还考察估计的稳定性以及区间估计的宽度与覆盖率。在许多情形下,基于平衡平方误差损失的贝叶斯估计比古典估计和使用不对称损失函数的贝叶斯估计更精确。研究还比较了几类区间估计,包括自助法(bootstrap)区间和贝叶斯最高后验密度区间。通常,基于百分位的自助区间优于更复杂的bootstrap-t方法,而贝叶斯区间——尤其是采用信息先验时——往往更短但仍能更频繁地覆盖真实可靠性。
从足球进球到空气污染极值的应用
随后,作者将其方法应用于两个真实数据集。第一个记录了两个赛季欧洲冠军联赛比赛中首个进球发生的分钟数,比较主场首回合与客场次回合比赛。在这里,“应力”和“强度”的角色有助于刻画哪一方更倾向于更早取得突破。第二个数据集涵盖近二十年加州长滩的月度二氧化硫浓度,比较春季与晚夏的水平。在这两种情况下,倒置指数帕累托模型比若干竞争分布更能拟合偏斜的重尾数据。仅使用从这些数据集中提取的上行记录,贝叶斯方法再次比古典方法产生更稳定的可靠性估计,这与模拟结果一致。
对可靠性评判的意义
对普通读者来说,主要结论是:当只有破纪录的极端值可用且底层行为呈长尾时,本文提供了一种有原则的方法来量化“足够安全是多少”。通过用一种灵活的分布同时建模应力与强度,并借助现代贝叶斯计算,作者展示了从相对稀疏的数据中获得可信的存活或失效概率及现实的不确定性带的可行性。他们的结果表明,在此类情形下,采用对误差平衡处理的贝叶斯方法能给出最可靠的答案,并且这些思想可跨领域应用——从工程元件到比赛时间与环境风险——在极端事件最重要的地方尤其适用。
引用: Hassan, A.S., Alballa, T., Alshawarbeh, E. et al. Reliability analysis in stress-strength model under record values with practical verification. Sci Rep 16, 14460 (2026). https://doi.org/10.1038/s41598-026-39638-6
关键词: 应力-强度 可靠性, 记录值, 贝叶斯估计, 重尾数据, 工程可靠性