列联表中变量独立性的卡方检验#

[1] 中,研究调查了阿司匹林在女性和男性中预防心血管事件的应用。该研究显著地得出结论:

……阿司匹林治疗通过其在降低女性缺血性中风风险方面的作用,降低了复合心血管事件的风险 […]

文章列出了关于各种心血管事件的研究。让我们关注女性的缺血性中风。

下表总结了参与者定期服用阿司匹林或安慰剂数年的实验结果。记录了缺血性中风病例:

阿司匹林

对照组/安慰剂

缺血性中风

176

230

未中风

21035

21018

有没有证据表明阿司匹林降低了缺血性中风的风险?我们首先提出一个零假设 \(H_0\)

阿司匹林的效果等同于安慰剂的效果。

让我们以观察到的列联表作为输入,使用卡方检验来评估该假设的合理性。

import numpy as np
from scipy.stats import chi2_contingency
table = np.array([[176, 230], [21035, 21018]])
res = chi2_contingency(table)
res.statistic
np.float64(6.892569132546561)
res.pvalue
np.float64(0.008655478161175739)

使用5%的显著性水平,我们将拒绝零假设,转而支持备择假设:“阿司匹林的效果与安慰剂的效果不相等”。因为scipy.stats.contingency.chi2_contingency执行双边检验,备择假设不指示效果的方向。我们可以使用scipy.stats.contingency.odds_ratio来支持阿司匹林降低缺血性中风风险的结论。

参考文献#