scipy.stats.

pmean#

scipy.stats.pmean(a, p, *, axis=0, dtype=None, weights=None, nan_policy='propagate', keepdims=False)[source]#

计算沿指定轴的加权幂平均值。

数组 \(a_i\) 关联到权重 \(w_i\) 的加权幂平均值为

\[\left( \frac{ \sum_{i=1}^n w_i a_i^p }{ \sum_{i=1}^n w_i } \right)^{ 1 / p } \, ,\]

并且,在等权重下,它给出

\[\left( \frac{ 1 }{ n } \sum_{i=1}^n a_i^p \right)^{ 1 / p } \, .\]

p=0 时,它返回几何平均值。

此平均值也称为广义平均值或 Hölder 平均值,不得与 Kolmogorov 广义平均值混淆, Kolmogorov 广义平均值也称为拟算术平均值或广义 f 平均值 [3]

参数:
aarray_like

输入数组、掩码数组或可以转换为数组的对象。

pint 或 float

指数。

axisint 或 None,默认值:0

如果为 int,则为计算统计量的输入数组的轴。输入的每个轴切片(例如,行)的统计量将显示在输出的相应元素中。如果为 None,则输入将在计算统计量之前被展平。

dtypedtype,可选

返回数组的类型以及元素在其中求和的累加器的类型。如果未指定 dtype,则默认为 a 的 dtype,除非 a 具有精度低于默认平台整数的整数 dtype。 在这种情况下,使用默认平台整数。

weightsarray_like,可选

权重数组可以是 1-D 的(在这种情况下,其长度必须是 a 沿给定 axis 的大小)或与 a 具有相同的形状。默认值为 None,这为每个值赋予 1.0 的权重。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

  • propagate:如果 NaN 存在于计算统计量的轴切片(例如,行)中,则输出的相应条目将为 NaN。

  • omit:执行计算时将省略 NaN。如果沿计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。

  • raise:如果存在 NaN,将引发 ValueError

keepdimsbool,默认值:False

如果将其设置为 True,则缩减的轴将保留在结果中,作为大小为 1 的维度。使用此选项,结果将与输入数组正确广播。

返回值:
pmeanndarray,请参见上面的 dtype 参数。

包含幂平均值的输出数组。

参见

numpy.average

加权平均值

gmean

几何平均值

hmean

调和平均值

注释

幂平均值是针对输入数组的单个维度计算的,默认情况下为 axis=0,如果 axis=None,则针对数组中的所有值计算。float64 中间值和返回值用于整数输入。

只有当所有观测值都是非负数时,幂平均值才被定义;否则,结果为 NaN。

在版本 1.9 中添加。

从 SciPy 1.9 开始,np.matrix 输入(不建议用于新代码)在执行计算之前会转换为 np.ndarray。在这种情况下,输出将是标量或具有适当形状的 np.ndarray,而不是 2D np.matrix。类似地,虽然会忽略掩码数组的掩码元素,但输出将是标量或 np.ndarray,而不是具有 mask=False 的掩码数组。

pmean 除了 NumPy 之外,还对 Python Array API Standard 兼容后端提供实验性支持。请考虑通过设置环境变量 SCIPY_ARRAY_API=1 并提供 CuPy、PyTorch、JAX 或 Dask 数组作为数组参数来测试这些功能。支持以下后端和设备(或其他功能)的组合。

CPU

GPU

NumPy

不适用

CuPy

不适用

PyTorch

JAX

⚠️ 无 JIT

⚠️ 无 JIT

Dask

⚠️ 计算图

不适用

有关更多信息,请参见 对数组 API 标准的支持

参考文献

[1]

“广义平均值”,维基百科, https://en.wikipedia.org/wiki/Generalized_mean

[2]

Norris, N., “广义平均值函数的凸性性质”,The Annals of Mathematical Statistics,第 8 卷,第 118-120 页,1937 年

[3]

Bullen, P.S., Mean手册及其不等式,2003

示例

>>> from scipy.stats import pmean, hmean, gmean
>>> pmean([1, 4], 1.3)
2.639372938300652
>>> pmean([1, 2, 3, 4, 5, 6, 7], 1.3)
4.157111214492084
>>> pmean([1, 4, 7], -2, weights=[3, 1, 3])
1.4969684896631954

对于 p=-1,幂平均值等于调和平均值

>>> pmean([1, 4, 7], -1, weights=[3, 1, 3])
1.9029126213592233
>>> hmean([1, 4, 7], weights=[3, 1, 3])
1.9029126213592233

对于 p=0,幂平均值定义为几何平均值

>>> pmean([1, 4, 7], 0, weights=[3, 1, 3])
2.80668351922014
>>> gmean([1, 4, 7], weights=[3, 1, 3])
2.80668351922014