掩码数组的统计函数 (scipy.stats.mstats)#

此模块包含大量可用于掩码数组的统计函数。

这些函数中的大多数与 scipy.stats 中的函数类似,但在 API 或使用的算法上可能存在细微差异。由于这是一个相对较新的软件包,一些 API 更改仍然是可能的。

汇总统计#

describe(a[, axis, ddof, bias])

计算传递数组的几个描述性统计量。

gmean(a[, axis, dtype, weights, nan_policy, ...])

计算指定轴上的加权几何平均值。

hmean(a[, axis, dtype, weights, nan_policy, ...])

计算指定轴上的加权调和平均值。

kurtosis(a[, axis, fisher, bias])

计算数据集的峰度(Fisher 或 Pearson)。

mode(a[, axis])

返回传递数组中模态(最常见)值的数组。

mquantiles(a[, prob, alphap, betap, axis, limit])

计算数据数组的经验分位数。

hdmedian(data[, axis, var])

返回给定轴上中值的 Harrell-Davis 估计值。

hdquantiles(data[, prob, axis, var])

使用 Harrell-Davis 方法计算分位数估计值。

hdquantiles_sd(data[, prob, axis])

通过刀切法计算 Harrell-Davis 分位数估计的标准误差。

idealfourths(data[, axis])

返回下四分位数和上四分位数的估计值。

plotting_positions(data[, alpha, beta])

返回数据的绘图位置(或经验百分位数点)。

meppf(data[, alpha, beta])

返回数据的绘图位置(或经验百分位数点)。

moment(a[, moment, axis])

计算样本均值的第 n 阶中心矩。

skew(a[, axis, bias])

计算数据集的偏度。

tmean(a[, limits, inclusive, axis])

计算截断均值。

tvar(a[, limits, inclusive, axis, ddof])

计算截断方差。

tmin(a[, lowerlimit, axis, inclusive])

计算截断最小值。

tmax(a[, upperlimit, axis, inclusive])

计算截断最大值。

tsem(a[, limits, inclusive, axis, ddof])

计算截断均值的标准误差。

variation(a[, axis, ddof])

计算变异系数。

find_repeats(arr)

查找 arr 中的重复项,并返回一个元组 (repeats, repeat_count)。

sem(a[, axis, ddof])

计算输入数组均值的标准误差。

trimmed_mean(a[, limits, inclusive, ...])

返回给定轴上数据的截断均值。

trimmed_mean_ci(data[, limits, inclusive, ...])

给定轴上截断均值的选定置信区间。

trimmed_std(a[, limits, inclusive, ...])

返回给定轴上数据的截断标准差。

trimmed_var(a[, limits, inclusive, ...])

返回给定轴上数据的截断方差。

频率统计#

scoreatpercentile(data, per[, limit, ...])

计算序列 a 中给定 'per' 百分位的分数。

相关函数#

f_oneway(*args)

执行单因素方差分析,返回 F 值和给定任意数量组的概率。

pearsonr(x, y)

皮尔逊相关系数和检验非相关的 p 值。

spearmanr(x[, y, use_ties, axis, ...])

计算斯皮尔曼等级相关系数和检验非相关的 p 值。

pointbiserialr(x, y)

计算点二列相关系数及其 p 值。

kendalltau(x, y[, use_ties, use_missing, ...])

计算两个变量 *x* 和 *y* 的肯德尔等级相关 tau。

kendalltau_seasonal(x)

计算季节性数据的多元 Kendall 等级相关 tau。

linregress(x[, y])

计算两组测量的线性最小二乘回归。

siegelslopes(y[, x, method])

计算一组点 (x, y) 的 Siegel 估计量。

theilslopes(y[, x, alpha, method])

计算一组点 (x, y) 的 Theil-Sen 估计量。

sen_seasonal_slopes(x)

计算季节性 Theil-Sen 和 Kendall 斜率估计量。

统计检验#

ttest_1samp(a, popmean[, axis, alternative])

计算单个样本得分均值的 T 检验。

ttest_onesamp(a, popmean[, axis, alternative])

计算单个样本得分均值的 T 检验。

ttest_ind(a, b[, axis, equal_var, alternative])

计算两个独立样本得分均值的 T 检验。

ttest_rel(a, b[, axis, alternative])

计算两个相关样本得分 a 和 b 的 T 检验。

chisquare(f_obs[, f_exp, ddof, axis, sum_check])

执行皮尔逊卡方检验。

kstest(data1, data2[, args, alternative, method])

参数:

ks_2samp(data1, data2[, alternative, method])

计算两个样本的 Kolmogorov-Smirnov 检验。

ks_1samp(x, cdf[, args, alternative, method])

计算一个掩码值样本的 Kolmogorov-Smirnov 检验。

ks_twosamp(data1, data2[, alternative, method])

计算两个样本的 Kolmogorov-Smirnov 检验。

mannwhitneyu(x, y[, use_continuity])

计算 Mann-Whitney 统计量

rankdata(data[, axis, use_missing])

返回给定轴上每个数据点的等级(也称为顺序统计量)。

kruskal(*args)

计算独立样本的 Kruskal-Wallis H 检验

kruskalwallis(*args)

计算独立样本的 Kruskal-Wallis H 检验

friedmanchisquare(*args)

Friedman 卡方检验是一种非参数的、单因素受试者内方差分析。

brunnermunzel(x, y[, alternative, distribution])

计算样本 x 和 y 的 Brunner-Munzel 检验。

skewtest(a[, axis, alternative])

检验偏度是否与正态分布不同。

kurtosistest(a[, axis, alternative])

检验数据集是否具有正态峰度

normaltest(a[, axis])

检验样本是否与正态分布不同。

变换#

obrientransform(*args)

计算输入数据(任意列数)的变换。

trim(a[, limits, inclusive, relative, axis])

通过屏蔽给定限制之外的数据来修剪数组。

trima(a[, limits, inclusive])

通过屏蔽给定限制之外的数据来修剪数组。

trimmed_stde(a[, limits, inclusive, axis])

返回给定轴上修剪平均值的标准误差。

trimr(a[, limits, inclusive, axis])

通过屏蔽每一端的部分数据来修剪数组。

trimtail(data[, proportiontocut, tail, ...])

通过屏蔽一尾的值来修剪数据。

trimboth(data[, proportiontocut, inclusive, ...])

修剪最小和最大的数据值。

winsorize(a[, limits, inclusive, inplace, ...])

返回输入数组的 Winsorized 版本。

zmap(scores, compare[, axis, ddof, nan_policy])

计算相对 z 分数。

zscore(a[, axis, ddof, nan_policy])

计算 z 分数。

其他#

argstoarray(*args)

从一组序列构造一个 2D 数组。

count_tied_groups(x[, use_missing])

计算绑定值的数量。

msign(x)

返回 x 的符号,如果 x 被屏蔽则返回 0。

compare_medians_ms(group_1, group_2[, axis])

比较给定轴上两个独立组的中位数。

median_cihs(data[, alpha, axis])

计算数据中位数 alpha 水平的置信区间。

mjci(data[, prob, axis])

返回数据选定实验分位数的标准误差的 Maritz-Jarrett 估计量。

mquantiles_cimj(data[, prob, alpha, axis])

使用 Maritz-Jarrett 估计量计算数据选定分位数的 alpha 置信区间。

rsh(data[, points])

评估每个数据点的 Rosenblatt 移动直方图估计量。