列联表中变量独立性的卡方检验#

[1] 中,研究了阿司匹林预防男女心血管事件的用途。 该研究的结论尤其指出

...阿司匹林治疗通过降低女性缺血性中风的风险来降低心血管事件的综合风险[...]

文章列出了各种心血管事件的研究。 让我们关注女性的缺血性中风。

下表总结了参与者定期服用阿司匹林或安慰剂数年的实验结果。 记录了缺血性中风病例:

阿司匹林

对照/安慰剂

缺血性中风

176

230

无中风

21035

21018

是否有证据表明阿司匹林可以降低缺血性中风的风险? 我们首先提出一个零假设 \(H_0\)

阿司匹林的效果与安慰剂的效果相同。

让我们使用 卡方 检验来评估该假设的合理性,并以观察到的列联表作为我们的输入。

import numpy as np
from scipy.stats import chi2_contingency
table = np.array([[176, 230], [21035, 21018]])
res = chi2_contingency(table)
res.statistic
6.892569132546561
res.pvalue
0.008655478161175739

使用 5% 的显著性水平,我们将拒绝零假设,支持备择假设:“阿司匹林的效果与安慰剂的效果不同”。 由于scipy.stats.contingency.chi2_contingency执行双尾检验,备择假设不表明效果的方向。 我们可以使用 scipy.stats.contingency.odds_ratio来支持阿司匹林降低缺血性中风风险的结论。

参考文献#