friedmanchisquare#
- scipy.stats.friedmanchisquare(*samples, axis=0, nan_policy='propagate', keepdims=False)[source]#
计算重复样本的弗里德曼检验。
弗里德曼检验检验了相同个体的重复样本具有相同分布的零假设。 它通常用于测试以不同方式获得的样本之间的一致性。 例如,如果在同一组个体上使用两种采样技术,则可以使用弗里德曼检验来确定这两种采样技术是否一致。
- 参数:
- sample1, sample2, sample3…array_like
观察值数组。 所有数组必须具有相同数量的元素。 必须至少给出三个样本。
- axisint 或 None,默认值:0
如果为 int,则为沿其计算统计量的输入的轴。 输入的每个轴切片(例如,行)的统计量将显示在输出的相应元素中。 如果为
None
,则将在计算统计量之前将输入展平。- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定义如何处理输入 NaN。
propagate
:如果沿其计算统计量的轴切片(例如,行)中存在 NaN,则输出的相应条目将为 NaN。omit
:执行计算时将省略 NaN。 如果沿其计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。raise
:如果存在 NaN,则将引发ValueError
。
- keepdimsbool,默认值:False
如果将其设置为 True,则缩减的轴将保留在结果中,作为大小为 1 的维度。 使用此选项,结果将针对输入数组正确广播。
- 返回值:
- statisticfloat
检验统计量,校正关系。
- pvaluefloat
相关的 p 值,假设检验统计量具有卡方分布。
另见
- 重复样本的弗里德曼检验
扩展示例
注意
由于假设检验统计量具有卡方分布,因此 p 值仅对于 n > 10 且重复样本超过 6 个时才可靠。
从 SciPy 1.9 开始,
np.matrix
输入(不建议用于新代码)在执行计算之前会转换为np.ndarray
。 在这种情况下,输出将是标量或适当形状的np.ndarray
,而不是 2Dnp.matrix
。 同样,虽然会忽略掩码数组的掩码元素,但输出将是标量或np.ndarray
,而不是mask=False
的掩码数组。参考文献
[2]Demsar, J. (2006). Statistical comparisons of classifiers over multiple data sets. Journal of Machine Learning Research, 7, 1-30.
示例
>>> import numpy as np >>> rng = np.random.default_rng(seed=18) >>> x = rng.random((6, 10)) >>> from scipy.stats import friedmanchisquare >>> res = friedmanchisquare(x[0], x[1], x[2], x[3], x[4], x[5]) >>> res.statistic, res.pvalue (11.428571428571416, 0.043514520866727614)
p 值小于 0.05; 但是,如上所述,由于我们有少量的重复样本,因此结果可能不可靠。
有关更详细的示例,请参见重复样本的弗里德曼检验。