掩码数组的统计函数 (scipy.stats.mstats)#

此模块包含大量可用于掩码数组的统计函数。

这些函数中的大多数与 scipy.stats 中的函数类似,但在 API 或所使用的算法上可能存在细微差异。由于这是一个相对较新的包,因此某些 API 更改仍然可能。

汇总统计#

describe(a[, axis, ddof, bias])

计算传入数组的多种描述性统计量。

gmean(a[, axis, dtype, weights, nan_policy, ...])

沿指定轴计算加权几何平均值。

hmean(a[, axis, dtype, weights, nan_policy, ...])

沿指定轴计算加权调和平均值。

kurtosis(a[, axis, fisher, bias])

计算数据集的峰度(Fisher 或 Pearson)。

mode(a[, axis])

返回传入数组中众数(最常见)值的数组。

mquantiles(a[, prob, alphap, betap, axis, limit])

计算数据数组的经验分位数。

hdmedian(data[, axis, var])

返回给定轴上中位数的海勒-戴维斯估计值。

hdquantiles(data[, prob, axis, var])

使用 Harrell-Davis 方法计算分位数估计值。

hdquantiles_sd(data[, prob, axis])

通过刀切法计算 Harrell-Davis 分位数估计值的标准误差。

idealfourths(data[, axis])

返回下四分位数和上四分位数估计值。

plotting_positions(data[, alpha, beta])

返回数据的绘图位置(或经验百分位数点)。

meppf(data[, alpha, beta])

返回数据的绘图位置(或经验百分位数点)。

moment(a[, moment, axis])

计算样本的关于均值的第 n 阶矩。

skew(a[, axis, bias])

计算数据集的偏度。

tmean(a[, limits, inclusive, axis])

计算截尾均值。

tvar(a[, limits, inclusive, axis, ddof])

计算截尾方差

tmin(a[, lowerlimit, axis, inclusive])

计算截尾最小值

tmax(a[, upperlimit, axis, inclusive])

计算截尾最大值

tsem(a[, limits, inclusive, axis, ddof])

计算截尾均值的标准误差。

variation(a[, axis, ddof])

计算变异系数。

find_repeats(arr)

在 arr 中查找重复项并返回一个元组 (重复项, 重复计数)。

sem(a[, axis, ddof])

计算输入数组均值的标准误差。

trimmed_mean(a[, limits, inclusive, ...])

返回给定轴上数据的截尾均值。

trimmed_mean_ci(data[, limits, inclusive, ...])

给定轴上截尾均值的选定置信区间。

trimmed_std(a[, limits, inclusive, ...])

返回给定轴上数据的截尾标准差。

trimmed_var(a[, limits, inclusive, ...])

返回给定轴上数据的截尾方差。

频率统计#

scoreatpercentile(data, per[, limit, ...])

计算序列 a 在给定 'per' 百分位数处的分数。

相关函数#

f_oneway(*args)

执行单向 ANOVA,返回任意数量组的 F 值和概率。

pearsonr(x, y)

用于检验不相关的 Pearson 相关系数和 p 值。

spearmanr(x[, y, use_ties, axis, ...])

计算 Spearman 等级相关系数和用于检验不相关的 p 值。

pointbiserialr(x, y)

计算点二列相关系数及其 p 值。

kendalltau(x, y[, use_ties, use_missing, ...])

计算两个变量 xy 的 Kendall 等级相关系数 tau。

kendalltau_seasonal(x)

计算多元 Kendall 等级相关系数 tau,用于季节性数据。

linregress(x[, y])

计算两组测量值的线性最小二乘回归。

siegelslopes(y[, x, method])

计算一组点 (x, y) 的 Siegel 估计量。

theilslopes(y[, x, alpha, method])

计算一组点 (x, y) 的 Theil-Sen 估计量。

sen_seasonal_slopes(x)

计算季节性 Theil-Sen 和 Kendall 斜率估计量。

统计检验#

ttest_1samp(a, popmean[, axis, alternative])

计算一组分数的均值的 T 检验。

ttest_onesamp(a, popmean[, axis, alternative])

计算一组分数的均值的 T 检验。

ttest_ind(a, b[, axis, equal_var, alternative])

计算两组独立分数样本均值的 T 检验。

ttest_rel(a, b[, axis, alternative])

对两组相关分数样本 a 和 b 执行 T 检验。

chisquare(f_obs[, f_exp, ddof, axis, ...])

执行 Pearson 卡方检验。

kstest(data1, data2[, args, alternative, method])

ks_2samp(data1, data2[, alternative, method])

计算两个样本的 Kolmogorov-Smirnov 检验。

ks_1samp(x, cdf[, args, alternative, method])

计算一个掩码值样本的 Kolmogorov-Smirnov 检验。

ks_twosamp(data1, data2[, alternative, method])

计算两个样本的 Kolmogorov-Smirnov 检验。

mannwhitneyu(x, y[, use_continuity])

计算 Mann-Whitney 统计量

rankdata(data[, axis, use_missing])

返回给定轴上每个数据点的秩(也称为顺序统计量)。

kruskal(*args)

计算独立样本的 Kruskal-Wallis H 检验

kruskalwallis(*args)

计算独立样本的 Kruskal-Wallis H 检验

friedmanchisquare(*args)

Friedman 卡方检验是非参数的,是单向受试者内 ANOVA。

brunnermunzel(x, y[, alternative, distribution])

对样本 x 和 y 执行 Brunner-Munzel 检验。

skewtest(a[, axis, alternative])

检验偏度是否与正态分布不同。

kurtosistest(a[, axis, alternative])

检验数据集是否具有正态峰度

normaltest(a[, axis])

检验样本是否与正态分布不同。

变换#

obrientransform(*args)

对输入数据(任意数量的列)执行变换。

trim(a[, limits, inclusive, relative, axis])

通过掩码超出给定限制的数据来修剪数组。

trima(a[, limits, inclusive])

通过掩码超出给定限制的数据来修剪数组。

trimmed_stde(a[, limits, inclusive, axis])

返回给定轴上截尾均值的标准误差。

trimr(a[, limits, inclusive, axis])

通过掩码每端一定比例的数据来修剪数组。

trimtail(data[, proportiontocut, tail, ...])

通过掩码一个尾部的值来修剪数据。

trimboth(data[, proportiontocut, inclusive, ...])

修剪最小和最大的数据值。

winsorize(a[, limits, inclusive, inplace, ...])

返回输入数组的 Winsorized 版本。

zmap(scores, compare[, axis, ddof, nan_policy])

计算相对 z 分数。

zscore(a[, axis, ddof, nan_policy])

计算 z 分数。

其他#

argstoarray(*args)

从一组序列构造一个二维数组。

count_tied_groups(x[, use_missing])

计算绑定的值数量。

msign(x)

返回 x 的符号,如果 x 被掩码则返回 0。

compare_medians_ms(group_1, group_2[, axis])

比较两个独立组在给定轴上的中位数。

median_cihs(data[, alpha, axis])

计算数据中位数的 alpha 级置信区间。

mjci(data[, prob, axis])

返回数据选定实验分位数标准误差的 Maritz-Jarrett 估计量。

mquantiles_cimj(data[, prob, alpha, axis])

使用 Maritz-Jarrett 估计量计算数据选定分位数的 alpha 置信区间。

rsh(data[, points])

计算每个数据点的 Rosenblatt 移位直方图估计量。