ttest_rel#
- scipy.stats.ttest_rel(a, b, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)[source]#
计算两组相关样本(a 和 b)的 t 检验。
这是一个检验两个相关或重复样本具有相同平均(期望)值的零假设的检验。
- 参数:
- a, b类数组
数组必须具有相同的形状。
- axisint 或 None, 默认值: 0
如果为 int,则为计算统计量所沿的输入轴。输入的每个轴切片(例如,行)的统计量将出现在输出的相应元素中。如果为
None
,则在计算统计量之前将输入展平。- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定义如何处理输入 NaN。
propagate
: 如果在计算统计量的轴切片(例如,行)中存在 NaN,则输出的相应条目将为 NaN。omit
: 执行计算时将忽略 NaN。如果沿计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。raise
: 如果存在 NaN,将引发ValueError
。
- alternative{‘two-sided’, ‘less’, ‘greater’}, 可选
定义备择假设。以下选项可用(默认值为 ‘two-sided’)
‘two-sided’:样本的基础分布的均值不相等。
‘less’:第一个样本的基础分布的均值小于第二个样本的基础分布的均值。
‘greater’:第一个样本的基础分布的均值大于第二个样本的基础分布的均值。
在 1.6.0 版本中添加。
- keepdimsbool, 默认值: False
如果设置为 True,则被缩减的轴将作为大小为 1 的维度保留在结果中。使用此选项,结果将正确地广播到输入数组。
- 返回值:
- result
TtestResult
具有以下属性的对象
- statisticfloat 或 array
t 统计量。
- pvaluefloat 或 array
与给定备择假设相关的 p 值。
- dffloat 或 array
用于计算 t 统计量的自由度数;这比样本大小小 1 (
a.shape[axis]
)。在 1.10.0 版本中添加。
该对象还具有以下方法
- confidence_interval(confidence_level=0.95)
计算给定置信水平下总体均值差异的置信区间。置信区间以
namedtuple
返回,包含字段 low 和 high。在 1.10.0 版本中添加。
- result
说明
使用的例子包括同一组学生在不同考试中的分数,或者从同一单位重复抽样。该测试衡量不同样本(例如,考试)的平均分数是否差异显着。如果我们观察到较大的 p 值,例如大于 0.05 或 0.1,那么我们不能拒绝相同平均分数的零假设。如果 p 值小于阈值,例如 1%、5% 或 10%,那么我们拒绝均值相等的零假设。小的 p 值与大的 t 统计量相关联。
t 统计量计算为
np.mean(a - b)/se
,其中se
是标准误差。因此,当a - b
的样本均值大于零时,t 统计量为正,当a - b
的样本均值小于零时,t 统计量为负。从 SciPy 1.9 开始,
np.matrix
输入(不建议用于新代码)在执行计算之前会转换为np.ndarray
。在这种情况下,输出将是标量或适当形状的np.ndarray
,而不是 2Dnp.matrix
。类似地,虽然会忽略 masked 数组的 masked 元素,但输出将是标量或np.ndarray
,而不是mask=False
的 masked 数组。ttest_rel
除了 NumPy 之外,还实验性地支持 Python Array API Standard 兼容后端。请考虑通过设置环境变量SCIPY_ARRAY_API=1
并提供 CuPy、PyTorch、JAX 或 Dask 数组作为数组参数来测试这些功能。支持以下后端和设备(或其他能力)的组合。库
CPU
GPU
NumPy
✅
不适用
CuPy
不适用
✅
PyTorch
✅
⛔
JAX
⚠️ 无 JIT
⚠️ 无 JIT
Dask
⚠️ 计算图
不适用
有关更多信息,请参见 对数组 API 标准的支持。
参考
https://en.wikipedia.org/wiki/T-test#Dependent_t-test_for_paired_samples
示例
>>> import numpy as np >>> from scipy import stats >>> rng = np.random.default_rng()
>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng) >>> rvs2 = (stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng) ... + stats.norm.rvs(scale=0.2, size=500, random_state=rng)) >>> stats.ttest_rel(rvs1, rvs2) TtestResult(statistic=-0.4549717054410304, pvalue=0.6493274702088672, df=499) >>> rvs3 = (stats.norm.rvs(loc=8, scale=10, size=500, random_state=rng) ... + stats.norm.rvs(scale=0.2, size=500, random_state=rng)) >>> stats.ttest_rel(rvs1, rvs3) TtestResult(statistic=-5.879467544540889, pvalue=7.540777129099917e-09, df=499)