scipy.stats.

skewtest#

scipy.stats.skewtest(a, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)[source]#

测试偏度是否与正态分布不同。

此函数测试零假设:样本的总体偏度与相应的正态分布相同。

参数:
aarray

要测试的数据。必须包含至少八个观测值。

axisint 或 None,默认值:0

如果为 int,则为计算统计量的输入轴。输入的每个轴切片(例如行)的统计量将显示在输出的相应元素中。如果为 None,则在计算统计量之前将输入展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

  • propagate:如果在计算统计量的轴切片(例如行)中存在 NaN,则输出的相应条目将为 NaN。

  • omit:执行计算时将省略 NaN。 如果在计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。

  • raise:如果存在 NaN,将引发 ValueError

alternative{‘two-sided’, ‘less’, ‘greater’}, 可选

定义备择假设。默认值为 ‘two-sided’。以下选项可用

  • ‘two-sided’:样本的基础分布的偏度与正态分布的偏度不同(即 0)

  • ‘less’:样本的基础分布的偏度小于正态分布的偏度

  • ‘greater’:样本的基础分布的偏度大于正态分布的偏度

1.7.0 版本新增。

keepdimsbool,默认值:False

如果设置为 True,则缩减的轴将保留在结果中,作为大小为 1 的维度。使用此选项,结果将针对输入数组正确广播。

返回值:
statisticfloat

此测试的计算 z 分数。

pvaluefloat

假设检验的 p 值。

参见

偏度测试

扩展示例

注释

样本大小必须至少为 8。

从 SciPy 1.9 开始,np.matrix 输入(不推荐用于新代码)在执行计算之前会转换为 np.ndarray。 在这种情况下,输出将是标量或适当形状的 np.ndarray,而不是 2D np.matrix。 类似地,虽然忽略了掩码数组的掩码元素,但输出将是标量或 np.ndarray,而不是 mask=False 的掩码数组。

skewtest 除了 NumPy 之外,还实验性地支持 Python Array API Standard 兼容后端。请考虑通过设置环境变量 SCIPY_ARRAY_API=1 并提供 CuPy、PyTorch、JAX 或 Dask 数组作为数组参数来测试这些功能。支持以下后端和设备(或其他功能)的组合。

CPU

GPU

NumPy

不适用

CuPy

不适用

PyTorch

JAX

⚠️ 无 JIT

⚠️ 无 JIT

Dask

⚠️ 计算图

不适用

有关更多信息,请参见对数组 API 标准的支持

参考文献

[1]

R. B. D’Agostino, A. J. Belanger and R. B. D’Agostino Jr., “A suggestion for using powerful and informative tests of normality”, American Statistician 44, pp. 316-321, 1990.

示例

>>> from scipy.stats import skewtest
>>> skewtest([1, 2, 3, 4, 5, 6, 7, 8])
SkewtestResult(statistic=1.0108048609177787, pvalue=0.3121098361421897)
>>> skewtest([2, 8, 0, 4, 1, 9, 9, 0])
SkewtestResult(statistic=0.44626385374196975, pvalue=0.6554066631275459)
>>> skewtest([1, 2, 3, 4, 5, 6, 7, 8000])
SkewtestResult(statistic=3.571773510360407, pvalue=0.0003545719905823133)
>>> skewtest([100, 100, 100, 100, 100, 100, 100, 101])
SkewtestResult(statistic=3.5717766638478072, pvalue=0.000354567720281634)
>>> skewtest([1, 2, 3, 4, 5, 6, 7, 8], alternative='less')
SkewtestResult(statistic=1.0108048609177787, pvalue=0.8439450819289052)
>>> skewtest([1, 2, 3, 4, 5, 6, 7, 8], alternative='greater')
SkewtestResult(statistic=1.0108048609177787, pvalue=0.15605491807109484)

有关更详细的示例,请参见偏度测试