scipy.stats.

kurtosistest#

scipy.stats.kurtosistest(a, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)[源代码]#

检验数据集是否具有正态峰度。

此函数检验从样本中抽取的总体的峰度是否为正态分布的峰度的零假设。

参数:
a数组

样本数据的数组。必须包含至少五个观测值。

axisint 或 None,默认值:0

如果为 int,则为计算统计量的输入轴。输入的每个轴切片(例如,行)的统计量将显示在输出的相应元素中。如果为 None,则在计算统计量之前将输入展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入的 NaN。

  • propagate:如果沿计算统计量的轴切片(例如,行)中存在 NaN,则输出的相应条目将为 NaN。

  • omit:执行计算时将省略 NaN。如果沿计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。

  • raise:如果存在 NaN,则会引发 ValueError

alternative{‘two-sided’, ‘less’, ‘greater’}, 可选

定义备择假设。以下选项可用(默认为 ‘two-sided’)

  • ‘two-sided’:样本底层分布的峰度与正态分布的峰度不同

  • ‘less’:样本底层分布的峰度小于正态分布的峰度

  • ‘greater’:样本底层分布的峰度大于正态分布的峰度

在 1.7.0 版本中添加。

keepdimsbool,默认值:False

如果将其设置为 True,则缩减的轴将保留在结果中,作为大小为 1 的维度。使用此选项,结果将正确地广播到输入数组。

返回:
statisticfloat

此检验计算出的 z 分数。

pvaluefloat

假设检验的 p 值。

另请参阅

峰度检验

扩展示例

说明

仅当 n>20 时有效。此函数使用 [1] 中描述的方法。

从 SciPy 1.9 开始,np.matrix 输入(不建议用于新代码)在执行计算之前会转换为 np.ndarray。在这种情况下,输出将是标量或适当形状的 np.ndarray,而不是二维 np.matrix。类似地,虽然会忽略掩码数组的掩码元素,但输出将是标量或 np.ndarray,而不是 mask=False 的掩码数组。

参考文献

[1]

F. J. Anscombe, W. J. Glynn, “Distribution of the kurtosis statistic b2 for normal samples”, Biometrika, vol. 70, pp. 227-234, 1983.

示例

>>> import numpy as np
>>> from scipy.stats import kurtosistest
>>> kurtosistest(list(range(20)))
KurtosistestResult(statistic=-1.7058104152122062, pvalue=0.08804338332528348)
>>> kurtosistest(list(range(20)), alternative='less')
KurtosistestResult(statistic=-1.7058104152122062, pvalue=0.04402169166264174)
>>> kurtosistest(list(range(20)), alternative='greater')
KurtosistestResult(statistic=-1.7058104152122062, pvalue=0.9559783083373583)
>>> rng = np.random.default_rng()
>>> s = rng.normal(0, 1, 1000)
>>> kurtosistest(s)
KurtosistestResult(statistic=-1.475047944490622, pvalue=0.14019965402996987)

有关更详细的示例,请参阅 峰度检验