scipy.stats.

describe#

scipy.stats.describe(a, axis=0, ddof=1, bias=True, nan_policy='propagate')[source]#

计算传入数组的多个描述性统计信息。

参数:

aarray_like

输入数据。

axisint 或 None，可选

计算统计信息的轴。默认为 0。如果为 None，则对整个数组 a 进行计算。

ddofint，可选

自由度的增量（仅适用于方差）。默认为 1。

biasbool，可选

如果为 False，则偏度和峰度的计算将针对统计偏差进行校正。

nan_policy{‘propagate’, ‘raise’, ‘omit’}, 可选

定义当输入包含 nan 时如何处理。以下选项可用（默认为“propagate”）

“propagate”：返回 nan
“raise”：抛出错误
“omit”：执行计算时忽略 nan 值

返回:

nobsint 或 int 的 ndarray: 观测数量（沿 axis 的数据长度）。当选择“omit”作为 nan_policy 时，将单独计算每个轴切片的长度。
minmax: ndarray 或 float 的元组: 沿给定轴的 a 的最小值和最大值。
meanndarray 或 float: 沿给定轴的 a 的算术平均值。
variancendarray 或 float: 沿给定轴的 a 的无偏方差；分母是观测数量减一。
skewnessndarray 或 float: 沿给定轴的 a 的偏度，基于力矩计算，其分母等于观测数量，即没有自由度校正。
kurtosisndarray 或 float: 沿给定轴的 a 的峰度 (Fisher)。峰度已标准化，因此对于正态分布，其值为零。不使用自由度。

引发:

ValueError: 如果 a 的大小为 0。

另请参阅

skew, kurtosis

注释

describe 除了 NumPy 之外，还实验性地支持 Python Array API Standard 兼容后端。请考虑通过设置环境变量 SCIPY_ARRAY_API=1 并提供 CuPy、PyTorch、JAX 或 Dask 数组作为数组参数来测试这些功能。支持以下后端和设备（或其他功能）的组合。

库	CPU	GPU
NumPy	✅	不适用
CuPy	不适用	✅
PyTorch	✅	✅
JAX	⚠️ 无 JIT	⚠️ 无 JIT
Dask	⚠️ 计算图	不适用

有关更多信息，请参阅对数组 API 标准的支持。

示例

>>> import numpy as np
>>> from scipy import stats
>>> a = np.arange(10)
>>> stats.describe(a)
DescribeResult(nobs=10, minmax=(0, 9), mean=4.5,
               variance=9.166666666666666, skewness=0.0,
               kurtosis=-1.2242424242424244)
>>> b = [[1, 2], [3, 4]]
>>> stats.describe(b)
DescribeResult(nobs=2, minmax=(array([1, 2]), array([3, 4])),
               mean=array([2., 3.]), variance=array([2., 2.]),
               skewness=array([0., 0.]), kurtosis=array([-2., -2.]))