scipy.stats.

ttest_1samp#

scipy.stats.ttest_1samp(a, popmean, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)[源代码]#

计算一组分数的均值的 T 检验。

这是一个检验零假设的检验，即独立观测样本 a 的期望值（均值）等于给定的总体均值 popmean。

参数:

aarray_like

样本观测值。

popmeanfloat 或 array_like

零假设中的期望值。如果 array_like，则其沿 axis 的长度必须等于 1，并且必须可以与 a 进行广播。

axisint 或 None，默认值：0

如果为 int，则为计算统计量的输入沿哪个轴。输入的每个轴切片（例如行）的统计量将出现在输出的相应元素中。如果为 None，则输入将在计算统计量之前被展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

propagate：如果在计算统计量的轴切片（例如行）中存在 NaN，则输出的相应条目将为 NaN。
omit：执行计算时将忽略 NaN。如果在计算统计量的轴切片中剩余的数据不足，则输出的相应条目将为 NaN。
raise：如果存在 NaN，则将引发 ValueError。

alternative{‘two-sided’, ‘less’, ‘greater’}, 可选

定义备择假设。以下选项可用（默认值为“two-sided”）

‘two-sided’：样本的基础分布的均值与给定的总体均值 (popmean) 不同
‘less’：样本的基础分布的均值小于给定的总体均值 (popmean)
‘greater’：样本的基础分布的均值大于给定的总体均值 (popmean)

keepdimsbool，默认值：False

如果设置为 True，则缩减的轴将保留在结果中，作为大小为 1 的维度。使用此选项，结果将与输入数组正确广播。

返回:

resultTtestResult

具有以下属性的对象

statisticfloat 或 array: t 统计量。
pvaluefloat 或 array: 与给定备择方案关联的 p 值。
dffloat 或 array: 计算 t 统计量时使用的自由度数；这比样本大小小 1 (a.shape[axis])。

在 1.10.0 版本中添加。

该对象还具有以下方法

confidence_interval(confidence_level=0.95): 计算给定置信水平下总体均值的置信区间。置信区间在具有字段 low 和 high 的 namedtuple 中返回。

在 1.10.0 版本中添加。

注释

该统计量计算为 (np.mean(a) - popmean)/se，其中 se 是标准误差。因此，当样本均值大于总体均值时，该统计量将为正；而当样本均值小于总体均值时，该统计量将为负。

从 SciPy 1.9 开始，np.matrix 输入（不建议用于新代码）在执行计算之前将转换为 np.ndarray。在这种情况下，输出将是标量或具有适当形状的 np.ndarray，而不是 2D np.matrix。同样，虽然会忽略屏蔽数组的屏蔽元素，但输出将是标量或 np.ndarray，而不是具有 mask=False 的屏蔽数组。

ttest_1samp 除了 NumPy 之外，还对 Python Array API 标准兼容后端提供实验性支持。请考虑通过设置环境变量 SCIPY_ARRAY_API=1 并提供 CuPy、PyTorch、JAX 或 Dask 数组作为数组参数来测试这些功能。支持以下后端和设备（或其他功能）的组合。

库	CPU	GPU
NumPy	✅	n/a
CuPy	n/a	✅
PyTorch	✅	⛔
JAX	⚠️ 无 JIT	⚠️ 无 JIT
Dask	⚠️ 计算图	n/a

有关更多信息，请参见对 array API 标准的支持。

示例

假设我们希望检验总体均值等于 0.5 的零假设。我们选择 99% 的置信水平；也就是说，如果 p 值小于 0.01，我们将拒绝零假设，转而支持备择假设。

当测试来自标准均匀分布（均值为 0.5）的随机变量时，我们期望数据与零假设一致。

>>> import numpy as np
>>> from scipy import stats
>>> rng = np.random.default_rng()
>>> rvs = stats.uniform.rvs(size=50, random_state=rng)
>>> stats.ttest_1samp(rvs, popmean=0.5)
TtestResult(statistic=2.456308468440, pvalue=0.017628209047638, df=49)

正如预期的那样，p 值 0.017 不低于我们的阈值 0.01，因此我们无法拒绝零假设。

当测试来自标准正态分布（均值为 0）的数据时，我们期望拒绝零假设。

>>> rvs = stats.norm.rvs(size=50, random_state=rng)
>>> stats.ttest_1samp(rvs, popmean=0.5)
TtestResult(statistic=-7.433605518875, pvalue=1.416760157221e-09, df=49)

实际上，p 值低于我们的阈值 0.01，因此我们拒绝零假设，转而支持默认的“双侧”备择假设：总体的均值不等于 0.5。

但是，假设我们要针对单侧备择假设检验零假设，即总体的均值大于 0.5。由于标准正态的均值小于 0.5，因此我们不希望拒绝零假设。

>>> stats.ttest_1samp(rvs, popmean=0.5, alternative='greater')
TtestResult(statistic=-7.433605518875, pvalue=0.99999999929, df=49)

毫不奇怪，由于 p 值大于我们的阈值，因此我们不会拒绝零假设。

请注意，当使用 99% 的置信水平时，真正的零假设将在大约 1% 的时间内被拒绝。

>>> rvs = stats.uniform.rvs(size=(100, 50), random_state=rng)
>>> res = stats.ttest_1samp(rvs, popmean=0.5, axis=1)
>>> np.sum(res.pvalue < 0.01)
1

实际上，即使上面的所有 100 个样本都是从标准均匀分布中抽取的，该分布确实具有 0.5 的总体均值，但我们仍会错误地拒绝其中一个样本的零假设。

ttest_1samp 还可以计算总体均值的置信区间。

>>> rvs = stats.norm.rvs(size=50, random_state=rng)
>>> res = stats.ttest_1samp(rvs, popmean=0)
>>> ci = res.confidence_interval(confidence_level=0.95)
>>> ci
ConfidenceInterval(low=-0.3193887540880017, high=0.2898583388980972)

95% 置信区间的范围是参数 popmean 的最小值和最大值，对于这些值，检验的 p 值为 0.05。

>>> res = stats.ttest_1samp(rvs, popmean=ci.low)
>>> np.testing.assert_allclose(res.pvalue, 0.05)
>>> res = stats.ttest_1samp(rvs, popmean=ci.high)
>>> np.testing.assert_allclose(res.pvalue, 0.05)

在对抽取样本的总体做出某些假设的情况下，置信水平为 95% 的置信区间预计在 95% 的样本重复中包含真实的总体均值。

>>> rvs = stats.norm.rvs(size=(50, 1000), loc=1, random_state=rng)
>>> res = stats.ttest_1samp(rvs, popmean=0)
>>> ci = res.confidence_interval()
>>> contains_pop_mean = (ci.low < 1) & (ci.high > 1)
>>> contains_pop_mean.sum()
953