scipy.stats.

friedmanchisquare#

scipy.stats.friedmanchisquare(*samples, axis=0, nan_policy='propagate', keepdims=False)[source]#

计算重复样本的弗里德曼检验。

弗里德曼检验检验了相同个体的重复样本具有相同分布的零假设。它通常用于测试以不同方式获得的样本之间的一致性。例如，如果在同一组个体上使用两种采样技术，则可以使用弗里德曼检验来确定这两种采样技术是否一致。

参数:

sample1, sample2, sample3…array_like

观察值数组。所有数组必须具有相同数量的元素。必须至少给出三个样本。

axisint 或 None，默认值：0

如果为 int，则为沿其计算统计量的输入的轴。输入的每个轴切片（例如，行）的统计量将显示在输出的相应元素中。如果为 None，则将在计算统计量之前将输入展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

propagate：如果沿其计算统计量的轴切片（例如，行）中存在 NaN，则输出的相应条目将为 NaN。
omit：执行计算时将省略 NaN。如果沿其计算统计量的轴切片中剩余的数据不足，则输出的相应条目将为 NaN。
raise：如果存在 NaN，则将引发 ValueError。

keepdimsbool，默认值：False

如果将其设置为 True，则缩减的轴将保留在结果中，作为大小为 1 的维度。使用此选项，结果将针对输入数组正确广播。

返回值:

statisticfloat: 检验统计量，校正关系。
pvaluefloat: 相关的 p 值，假设检验统计量具有卡方分布。

另见

重复样本的弗里德曼检验: 扩展示例

注意

由于假设检验统计量具有卡方分布，因此 p 值仅对于 n > 10 且重复样本超过 6 个时才可靠。

从 SciPy 1.9 开始，np.matrix 输入（不建议用于新代码）在执行计算之前会转换为 np.ndarray。在这种情况下，输出将是标量或适当形状的 np.ndarray，而不是 2D np.matrix。同样，虽然会忽略掩码数组的掩码元素，但输出将是标量或 np.ndarray，而不是 mask=False 的掩码数组。

参考文献

[1]

https://en.wikipedia.org/wiki/Friedman_test

[2]

Demsar, J. (2006). Statistical comparisons of classifiers over multiple data sets. Journal of Machine Learning Research, 7, 1-30.

示例

>>> import numpy as np
>>> rng = np.random.default_rng(seed=18)
>>> x = rng.random((6, 10))
>>> from scipy.stats import friedmanchisquare
>>> res = friedmanchisquare(x[0], x[1], x[2], x[3], x[4], x[5])
>>> res.statistic, res.pvalue
(11.428571428571416, 0.043514520866727614)

p 值小于 0.05；但是，如上所述，由于我们有少量的重复样本，因此结果可能不可靠。

有关更详细的示例，请参见重复样本的弗里德曼检验。