scipy.stats.

normaltest#

scipy.stats.normaltest(a, axis=0, nan_policy='propagate', *, keepdims=False)[源代码]#

测试样本是否与正态分布不同。

此函数测试样本来自正态分布的零假设。它基于 D’Agostino 和 Pearson 的 [1], [2] 测试，该测试结合了偏度和峰度，以产生正态性的综合测试。

参数:

aarray_like

包含要测试的样本的数组。必须包含至少八个观察值。

axisint 或 None, 默认值: 0

如果为 int，则为计算统计量的输入轴。输入的每个轴切片（例如行）的统计信息将显示在输出的相应元素中。如果为 None，则在计算统计量之前将展平输入。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

propagate: 如果在计算统计量的轴切片（例如行）中存在 NaN，则输出的相应条目将为 NaN。
omit: 执行计算时将省略 NaN。如果在计算统计量的轴切片中剩余的数据不足，则输出的相应条目将为 NaN。
raise: 如果存在 NaN，将引发 ValueError。

keepdimsbool, 默认值: False

如果设置为 True，则将缩小的轴保留在结果中，作为大小为 1 的维度。使用此选项，结果将正确地广播到输入数组。

返回:

statisticfloat 或 array: s^2 + k^2, 其中 s 是由 skewtest 返回的 z 分数，而 k 是由 kurtosistest 返回的 z 分数。
pvaluefloat 或 array: 假设检验的 2 侧卡方概率。

参见

正态性检验: 扩展示例

注释

从 SciPy 1.9 开始，np.matrix 输入（不建议用于新代码）在执行计算之前转换为 np.ndarray。在这种情况下，输出将是标量或适当形状的 np.ndarray，而不是 2D np.matrix。同样，虽然会忽略屏蔽数组的屏蔽元素，但输出将是标量或 np.ndarray，而不是 mask=False 的屏蔽数组。

normaltest 除了 NumPy 之外，还对 Python Array API Standard 兼容后端提供实验性支持。请考虑通过设置环境变量 SCIPY_ARRAY_API=1 并提供 CuPy、PyTorch、JAX 或 Dask 数组作为数组参数来测试这些功能。支持以下后端和设备（或其他能力）的组合。

库	CPU	GPU
NumPy	✅	不适用
CuPy	不适用	✅
PyTorch	✅	✅
JAX	⚠️ 无 JIT	⚠️ 无 JIT
Dask	⚠️ 计算图	不适用

有关更多信息，请参见对数组 API 标准的支持。

参考文献

[1]

D’Agostino, R. B. (1971), “An omnibus test of normality for moderate and large sample size”, Biometrika, 58, 341-348

[2]

D’Agostino, R. and Pearson, E. S. (1973), “Tests for departure from normality”, Biometrika, 60, 613-622

示例

>>> import numpy as np
>>> from scipy import stats
>>> rng = np.random.default_rng()
>>> pts = 1000
>>> a = rng.normal(0, 1, size=pts)
>>> b = rng.normal(2, 1, size=pts)
>>> x = np.concatenate((a, b))
>>> res = stats.normaltest(x)
>>> res.statistic
53.619...  # random
>>> res.pvalue
2.273917413209226e-12  # random

有关更详细的示例，请参见正态性检验。