spearmanr#
- scipy.stats.mstats.spearmanr(x, y=None, use_ties=True, axis=None, nan_policy='propagate', alternative='two-sided')[source]#
计算 Spearman 秩相关系数和用于检验非相关的 p 值。
Spearman 相关性是非参数方法,用于衡量两个数据集之间的线性关系。与 Pearson 相关性不同,Spearman 相关性不假定两个数据集都呈正态分布。与其他相关系数一样,该系数在 -1 和 +1 之间变化,0 表示没有相关性。-1 或 +1 的相关性表示单调关系。正相关表示当 x 增加时,y 也会增加。负相关表示当 x 增加时,y 减小。
缺失值成对丢弃:如果 x 中缺少值,则 y 中的对应值将被屏蔽。
p 值大致表示一个非相关系统生成具有与从这些数据集计算出的 Spearman 相关性至少一样极端的 Spearman 相关性的数据集的概率。p 值不是完全可靠的,但对于大于 500 左右的数据集可能是合理的。
- 参数:
- x, y1D 或 2D 类数组,y 是可选的
一个或两个包含多个变量和观测值的 1-D 或 2-D 数组。当这些数组是 1-D 时,每个数组代表单个变量的观测值向量。对于 2-D 情况下的行为,请参见下面的
axis
。- use_tiesbool,可选
请勿使用。没有任何作用,保留此关键字仅是为了向后兼容性。
- axisint 或 None,可选
如果 axis=0(默认),则每列代表一个变量,观测值位于行中。如果 axis=1,则关系转置:每行代表一个变量,而列包含观测值。如果 axis=None,则两个数组都将被展平。
- nan_policy{‘propagate’, ‘raise’, ‘omit’}, 可选
定义输入包含 nan 时如何处理。“propagate”返回 nan,“raise”抛出错误,“omit”执行计算时忽略 nan 值。默认为“propagate”。
- alternative{‘two-sided’, ‘less’, ‘greater’}, 可选
定义备择假设。默认为“two-sided”。以下选项可用
‘two-sided’:相关性非零
‘less’:相关性为负(小于零)
‘greater’:相关性为正(大于零)
1.7.0 版本中添加。
- 返回:
- resSignificanceResult
包含属性的对象
- statisticfloat 或 ndarray(2-D 正方形)
Spearman 相关矩阵或相关系数(如果仅将 2 个变量作为参数给出)。相关矩阵是正方形,长度等于
a
和b
中变量(列或行)的总数之和。- pvaluefloat
假设检验的 p 值,其零假设是两组数据线性不相关。有关备择假设,请参见上面的 alternative。pvalue 的形状与 statistic 相同。
参考文献
[CRCProbStat2000] 第 14.7 节