scipy.stats.

ttest_rel#

scipy.stats.ttest_rel(a, b, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)[source]#

计算两组相关样本（a 和 b）的 t 检验。

这是一个检验两个相关或重复样本具有相同平均（期望）值的零假设的检验。

参数:

a, b类数组

数组必须具有相同的形状。

axisint 或 None, 默认值: 0

如果为 int，则为计算统计量所沿的输入轴。输入的每个轴切片（例如，行）的统计量将出现在输出的相应元素中。如果为 None，则在计算统计量之前将输入展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

propagate: 如果在计算统计量的轴切片（例如，行）中存在 NaN，则输出的相应条目将为 NaN。
omit: 执行计算时将忽略 NaN。如果沿计算统计量的轴切片中剩余的数据不足，则输出的相应条目将为 NaN。
raise: 如果存在 NaN，将引发 ValueError。

alternative{‘two-sided’, ‘less’, ‘greater’}, 可选

定义备择假设。以下选项可用（默认值为 ‘two-sided’）

‘two-sided’：样本的基础分布的均值不相等。
‘less’：第一个样本的基础分布的均值小于第二个样本的基础分布的均值。
‘greater’：第一个样本的基础分布的均值大于第二个样本的基础分布的均值。

在 1.6.0 版本中添加。

keepdimsbool, 默认值: False

如果设置为 True，则被缩减的轴将作为大小为 1 的维度保留在结果中。使用此选项，结果将正确地广播到输入数组。

返回值:

resultTtestResult

具有以下属性的对象

statisticfloat 或 array: t 统计量。
pvaluefloat 或 array: 与给定备择假设相关的 p 值。
dffloat 或 array: 用于计算 t 统计量的自由度数；这比样本大小小 1 (a.shape[axis])。

在 1.10.0 版本中添加。

该对象还具有以下方法

confidence_interval(confidence_level=0.95): 计算给定置信水平下总体均值差异的置信区间。置信区间以 namedtuple 返回，包含字段 low 和 high。

在 1.10.0 版本中添加。

说明

使用的例子包括同一组学生在不同考试中的分数，或者从同一单位重复抽样。该测试衡量不同样本（例如，考试）的平均分数是否差异显着。如果我们观察到较大的 p 值，例如大于 0.05 或 0.1，那么我们不能拒绝相同平均分数的零假设。如果 p 值小于阈值，例如 1%、5% 或 10%，那么我们拒绝均值相等的零假设。小的 p 值与大的 t 统计量相关联。

t 统计量计算为 np.mean(a - b)/se，其中 se 是标准误差。因此，当 a - b 的样本均值大于零时，t 统计量为正，当 a - b 的样本均值小于零时，t 统计量为负。

从 SciPy 1.9 开始，np.matrix 输入（不建议用于新代码）在执行计算之前会转换为 np.ndarray。在这种情况下，输出将是标量或适当形状的 np.ndarray，而不是 2D np.matrix。类似地，虽然会忽略 masked 数组的 masked 元素，但输出将是标量或 np.ndarray，而不是 mask=False 的 masked 数组。

ttest_rel 除了 NumPy 之外，还实验性地支持 Python Array API Standard 兼容后端。请考虑通过设置环境变量 SCIPY_ARRAY_API=1 并提供 CuPy、PyTorch、JAX 或 Dask 数组作为数组参数来测试这些功能。支持以下后端和设备（或其他能力）的组合。

库	CPU	GPU
NumPy	✅	不适用
CuPy	不适用	✅
PyTorch	✅	⛔
JAX	⚠️ 无 JIT	⚠️ 无 JIT
Dask	⚠️ 计算图	不适用

有关更多信息，请参见对数组 API 标准的支持。

参考

https://en.wikipedia.org/wiki/T-test#Dependent_t-test_for_paired_samples

示例

>>> import numpy as np
>>> from scipy import stats
>>> rng = np.random.default_rng()

>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng)
>>> rvs2 = (stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng)
...         + stats.norm.rvs(scale=0.2, size=500, random_state=rng))
>>> stats.ttest_rel(rvs1, rvs2)
TtestResult(statistic=-0.4549717054410304, pvalue=0.6493274702088672, df=499)
>>> rvs3 = (stats.norm.rvs(loc=8, scale=10, size=500, random_state=rng)
...         + stats.norm.rvs(scale=0.2, size=500, random_state=rng))
>>> stats.ttest_rel(rvs1, rvs3)
TtestResult(statistic=-5.879467544540889, pvalue=7.540777129099917e-09, df=499)