掩码数组的统计函数 (`scipy.stats.mstats`)#

此模块包含大量可用于掩码数组的统计函数。

这些函数中的大多数与 scipy.stats 中的函数类似，但在 API 或所使用的算法上可能存在细微差异。由于这是一个相对较新的包，因此某些 API 更改仍然可能。

汇总统计#

`describe`(a[, axis, ddof, bias])	计算传入数组的多种描述性统计量。
`gmean`(a[, axis, dtype, weights, nan_policy, ...])	沿指定轴计算加权几何平均值。
`hmean`(a[, axis, dtype, weights, nan_policy, ...])	沿指定轴计算加权调和平均值。
`kurtosis`(a[, axis, fisher, bias])	计算数据集的峰度（Fisher 或 Pearson）。
`mode`(a[, axis])	返回传入数组中众数（最常见）值的数组。
`mquantiles`(a[, prob, alphap, betap, axis, limit])	计算数据数组的经验分位数。
`hdmedian`(data[, axis, var])	返回给定轴上中位数的海勒-戴维斯估计值。
`hdquantiles`(data[, prob, axis, var])	使用 Harrell-Davis 方法计算分位数估计值。
`hdquantiles_sd`(data[, prob, axis])	通过刀切法计算 Harrell-Davis 分位数估计值的标准误差。
`idealfourths`(data[, axis])	返回下四分位数和上四分位数估计值。
`plotting_positions`(data[, alpha, beta])	返回数据的绘图位置（或经验百分位数点）。
`meppf`(data[, alpha, beta])	返回数据的绘图位置（或经验百分位数点）。
`moment`(a[, moment, axis])	计算样本的关于均值的第 n 阶矩。
`skew`(a[, axis, bias])	计算数据集的偏度。
`tmean`(a[, limits, inclusive, axis])	计算截尾均值。
`tvar`(a[, limits, inclusive, axis, ddof])	计算截尾方差
`tmin`(a[, lowerlimit, axis, inclusive])	计算截尾最小值
`tmax`(a[, upperlimit, axis, inclusive])	计算截尾最大值
`tsem`(a[, limits, inclusive, axis, ddof])	计算截尾均值的标准误差。
`variation`(a[, axis, ddof])	计算变异系数。
`find_repeats`(arr)	在 arr 中查找重复项并返回一个元组 (重复项, 重复计数)。
`sem`(a[, axis, ddof])	计算输入数组均值的标准误差。
`trimmed_mean`(a[, limits, inclusive, ...])	返回给定轴上数据的截尾均值。
`trimmed_mean_ci`(data[, limits, inclusive, ...])	给定轴上截尾均值的选定置信区间。
`trimmed_std`(a[, limits, inclusive, ...])	返回给定轴上数据的截尾标准差。
`trimmed_var`(a[, limits, inclusive, ...])	返回给定轴上数据的截尾方差。

频率统计#

scoreatpercentile(data, per[, limit, ...])

计算序列 a 在给定 'per' 百分位数处的分数。

相关函数#

`f_oneway`(*args)	执行单向 ANOVA，返回任意数量组的 F 值和概率。
`pearsonr`(x, y)	用于检验不相关的 Pearson 相关系数和 p 值。
`spearmanr`(x[, y, use_ties, axis, ...])	计算 Spearman 等级相关系数和用于检验不相关的 p 值。
`pointbiserialr`(x, y)	计算点二列相关系数及其 p 值。
`kendalltau`(x, y[, use_ties, use_missing, ...])	计算两个变量 x 和 y 的 Kendall 等级相关系数 tau。
`kendalltau_seasonal`(x)	计算多元 Kendall 等级相关系数 tau，用于季节性数据。
`linregress`(x[, y])	计算两组测量值的线性最小二乘回归。
`siegelslopes`(y[, x, method])	计算一组点 (x, y) 的 Siegel 估计量。
`theilslopes`(y[, x, alpha, method])	计算一组点 (x, y) 的 Theil-Sen 估计量。
`sen_seasonal_slopes`(x)	计算季节性 Theil-Sen 和 Kendall 斜率估计量。

统计检验#

`ttest_1samp`(a, popmean[, axis, alternative])	计算一组分数的均值的 T 检验。
`ttest_onesamp`(a, popmean[, axis, alternative])	计算一组分数的均值的 T 检验。
`ttest_ind`(a, b[, axis, equal_var, alternative])	计算两组独立分数样本均值的 T 检验。
`ttest_rel`(a, b[, axis, alternative])	对两组相关分数样本 a 和 b 执行 T 检验。
`chisquare`(f_obs[, f_exp, ddof, axis, ...])	执行 Pearson 卡方检验。
`kstest`(data1, data2[, args, alternative, method])
`ks_2samp`(data1, data2[, alternative, method])	计算两个样本的 Kolmogorov-Smirnov 检验。
`ks_1samp`(x, cdf[, args, alternative, method])	计算一个掩码值样本的 Kolmogorov-Smirnov 检验。
`ks_twosamp`(data1, data2[, alternative, method])	计算两个样本的 Kolmogorov-Smirnov 检验。
`mannwhitneyu`(x, y[, use_continuity])	计算 Mann-Whitney 统计量
`rankdata`(data[, axis, use_missing])	返回给定轴上每个数据点的秩（也称为顺序统计量）。
`kruskal`(*args)	计算独立样本的 Kruskal-Wallis H 检验
`kruskalwallis`(*args)	计算独立样本的 Kruskal-Wallis H 检验
`friedmanchisquare`(*args)	Friedman 卡方检验是非参数的，是单向受试者内 ANOVA。
`brunnermunzel`(x, y[, alternative, distribution])	对样本 x 和 y 执行 Brunner-Munzel 检验。
`skewtest`(a[, axis, alternative])	检验偏度是否与正态分布不同。
`kurtosistest`(a[, axis, alternative])	检验数据集是否具有正态峰度
`normaltest`(a[, axis])	检验样本是否与正态分布不同。

变换#

`obrientransform`(*args)	对输入数据（任意数量的列）执行变换。
`trim`(a[, limits, inclusive, relative, axis])	通过掩码超出给定限制的数据来修剪数组。
`trima`(a[, limits, inclusive])	通过掩码超出给定限制的数据来修剪数组。
`trimmed_stde`(a[, limits, inclusive, axis])	返回给定轴上截尾均值的标准误差。
`trimr`(a[, limits, inclusive, axis])	通过掩码每端一定比例的数据来修剪数组。
`trimtail`(data[, proportiontocut, tail, ...])	通过掩码一个尾部的值来修剪数据。
`trimboth`(data[, proportiontocut, inclusive, ...])	修剪最小和最大的数据值。
`winsorize`(a[, limits, inclusive, inplace, ...])	返回输入数组的 Winsorized 版本。
`zmap`(scores, compare[, axis, ddof, nan_policy])	计算相对 z 分数。
`zscore`(a[, axis, ddof, nan_policy])	计算 z 分数。

其他#

`argstoarray`(*args)	从一组序列构造一个二维数组。
`count_tied_groups`(x[, use_missing])	计算绑定的值数量。
`msign`(x)	返回 x 的符号，如果 x 被掩码则返回 0。
`compare_medians_ms`(group_1, group_2[, axis])	比较两个独立组在给定轴上的中位数。
`median_cihs`(data[, alpha, axis])	计算数据中位数的 alpha 级置信区间。
`mjci`(data[, prob, axis])	返回数据选定实验分位数标准误差的 Maritz-Jarrett 估计量。
`mquantiles_cimj`(data[, prob, alpha, axis])	使用 Maritz-Jarrett 估计量计算数据选定分位数的 alpha 置信区间。
`rsh`(data[, points])	计算每个数据点的 Rosenblatt 移位直方图估计量。