掩码数组的统计函数 (scipy.stats.mstats)#

此模块包含大量可用于掩码数组的统计函数。

大多数这些函数与 scipy.stats 中的函数相似,但 API 或使用的算法可能存在细微差异。由于这是一个相对较新的包,因此一些 API 更改仍然可能发生。

汇总统计量#

describe(a[, axis, ddof, bias])

计算传递数组的几个描述性统计量。

gmean(a[, axis, dtype, weights, nan_policy, ...])

计算指定轴上的加权几何平均值。

hmean(a[, axis, dtype, weights, nan_policy, ...])

计算指定轴上的加权调和平均值。

kurtosis(a[, axis, fisher, bias])

计算数据集的峰度(Fisher 或 Pearson)。

mode(a[, axis])

返回传递数组中众数(最常见)值的数组。

mquantiles(a[, prob, alphap, betap, axis, limit])

计算数据数组的经验分位数。

hdmedian(data[, axis, var])

返回给定轴上的 Harrell-Davis 中位数估计值。

hdquantiles(data[, prob, axis, var])

使用 Harrell-Davis 方法计算分位数估计值。

hdquantiles_sd(data[, prob, axis])

Harrell-Davis 分位数估计值的标准误差(通过自助法)。

idealfourths(data[, axis])

返回对下四分位数和上四分位数的估计。

plotting_positions(data[, alpha, beta])

返回数据的绘图位置(或经验百分位点)。

meppf(data[, alpha, beta])

返回数据的绘图位置(或经验百分位点)。

moment(a[, moment, axis])

计算样本关于均值的第 n 阶矩。

skew(a[, axis, bias])

计算数据集的偏度。

tmean(a[, limits, inclusive, axis])

计算修剪后的平均值。

tvar(a[, limits, inclusive, axis, ddof])

计算修剪后的方差

tmin(a[, lowerlimit, axis, inclusive])

计算修剪后的最小值

tmax(a[, upperlimit, axis, inclusive])

计算修剪后的最大值

tsem(a[, limits, inclusive, axis, ddof])

计算修剪后的平均值标准误差。

variation(a[, axis, ddof])

计算变异系数。

find_repeats(arr)

在 arr 中查找重复项,并返回一个元组 (repeats, repeat_count)。

sem(a[, axis, ddof])

计算输入数组的平均值的标准误差。

trimmed_mean(a[, limits, inclusive, ...])

返回给定轴上数据的修剪后的平均值。

trimmed_mean_ci(data[, limits, inclusive, ...])

选择给定轴上修剪后的平均值的置信区间。

trimmed_std(a[, limits, inclusive, ...])

返回给定轴上数据的修剪后的标准差。

trimmed_var(a[, limits, inclusive, ...])

返回给定轴上数据的修剪后的方差。

频率统计量#

scoreatpercentile(data, per[, limit, ...])

计算序列 a 的给定 'per' 百分位数的得分。

相关函数#

f_oneway(*args)

执行单因素方差分析,返回任何数量组的 F 值和概率。

pearsonr(x, y)

用于检验非相关性的皮尔逊相关系数和 p 值。

spearmanr(x[, y, use_ties, axis, ...])

计算斯皮尔曼等级相关系数和检验非相关性的 p 值。

pointbiserialr(x, y)

计算点二列相关系数及其 p 值。

kendalltau(x, y[, use_ties, use_missing, ...])

计算两个变量 *x* 和 *y* 上的肯德尔等级相关系数 τ。

kendalltau_seasonal(x)

计算季节性数据的多元肯德尔等级相关系数 τ。

linregress(x[, y])

为两组测量值计算线性最小二乘回归。

siegelslopes(y[, x, method])

计算一组点 (x, y) 的 Siegel 估计量。

theilslopes(y[, x, alpha, method])

计算一组点 (x, y) 的 Theil-Sen 估计量。

sen_seasonal_slopes(x)

计算季节性 Theil-Sen 和 Kendall 坡度估计量。

统计检验#

ttest_1samp(a, popmean[, axis, alternative])

计算一组分数的均值的 T 检验。

ttest_onesamp(a, popmean[, axis, alternative])

计算一组分数的均值的 T 检验。

ttest_ind(a, b[, axis, equal_var, alternative])

计算两个独立样本分数均值的T检验。

ttest_rel(a, b[, axis, alternative])

计算两个相关样本分数a和b的T检验。

chisquare(f_obs[, f_exp, ddof, axis])

计算单向卡方检验。

kstest(data1, data2[, args, alternative, method])

参数::

ks_2samp(data1, data2[, alternative, method])

计算两个样本的 Kolmogorov-Smirnov 检验。

ks_1samp(x, cdf[, args, alternative, method])

计算一个掩码值样本的 Kolmogorov-Smirnov 检验。

ks_twosamp(data1, data2[, alternative, method])

计算两个样本的 Kolmogorov-Smirnov 检验。

mannwhitneyu(x, y[, use_continuity])

计算 Mann-Whitney 统计量

rankdata(data[, axis, use_missing])

返回给定轴上每个数据点的秩(也称为顺序统计量)。

kruskal(*args)

计算独立样本的 Kruskal-Wallis H 检验

kruskalwallis(*args)

计算独立样本的 Kruskal-Wallis H 检验

friedmanchisquare(*args)

Friedman 卡方检验是一种非参数的单向受试者方差分析。

brunnermunzel(x, y[, alternative, distribution])

对样本 x 和 y 计算 Brunner-Munzel 检验。

skewtest(a[, axis, alternative])

测试偏度是否不同于正态分布。

kurtosistest(a[, axis, alternative])

测试数据集是否具有正态峰度

normaltest(a[, axis])

测试样本是否与正态分布不同。

转换#

obrientransform(*args)

对输入数据(任意数量的列)进行转换。

trim(a[, limits, inclusive, relative, axis])

通过屏蔽给定限制之外的数据来修剪数组。

trima(a[, limits, inclusive])

通过屏蔽给定限制之外的数据来修剪数组。

trimmed_stde(a[, limits, inclusive, axis])

返回给定轴上修剪均值的标准误差。

trimr(a[, limits, inclusive, axis])

通过屏蔽每端一定比例的数据来修剪数组。

trimtail(data[, proportiontocut, tail, ...])

通过屏蔽一端的值来修剪数据。

trimboth(data[, proportiontocut, inclusive, ...])

修剪最小和最大的数据值。

winsorize(a[, limits, inclusive, inplace, ...])

返回输入数组的 Winsorized 版本。

zmap(scores, compare[, axis, ddof, nan_policy])

计算相对 z 分数。

zscore(a[, axis, ddof, nan_policy])

计算 z 分数。

其他#

argstoarray(*args)

从一组序列构建一个二维数组。

count_tied_groups(x[, use_missing])

计算相等值的个数。

msign(x)

返回 x 的符号,如果 x 被屏蔽,则返回 0。

compare_medians_ms(group_1, group_2[, axis])

比较给定轴上两个独立组的中位数。

median_cihs(data[, alpha, axis])

计算数据的 alpha 水平置信区间。

mjci(data[, prob, axis])

返回数据选定实验分位数的标准误差的 Maritz-Jarrett 估计量。

mquantiles_cimj(data[, prob, alpha, axis])

使用 Maritz-Jarrett 估计量计算数据的选定分位数的 alpha 置信区间。

rsh(data[, points])

评估每个数据点的 Rosenblatt 移位直方图估计量。