scipy.stats.
describe#
- scipy.stats.describe(a, axis=0, ddof=1, bias=True, nan_policy='propagate')[source]#
计算传入数组的多个描述性统计信息。
- 参数:
- aarray_like
输入数据。
- axisint 或 None,可选
计算统计信息的轴。 默认为 0。如果为 None,则对整个数组 a 进行计算。
- ddofint,可选
自由度的增量(仅适用于方差)。 默认为 1。
- biasbool,可选
如果为 False,则偏度和峰度的计算将针对统计偏差进行校正。
- nan_policy{‘propagate’, ‘raise’, ‘omit’}, 可选
定义当输入包含 nan 时如何处理。 以下选项可用(默认为“propagate”)
“propagate”:返回 nan
“raise”:抛出错误
“omit”:执行计算时忽略 nan 值
- 返回:
- nobsint 或 int 的 ndarray
观测数量(沿 axis 的数据长度)。 当选择“omit”作为 nan_policy 时,将单独计算每个轴切片的长度。
- minmax: ndarray 或 float 的元组
沿给定轴的 a 的最小值和最大值。
- meanndarray 或 float
沿给定轴的 a 的算术平均值。
- variancendarray 或 float
沿给定轴的 a 的无偏方差;分母是观测数量减一。
- skewnessndarray 或 float
沿给定轴的 a 的偏度,基于力矩计算,其分母等于观测数量,即没有自由度校正。
- kurtosisndarray 或 float
沿给定轴的 a 的峰度 (Fisher)。 峰度已标准化,因此对于正态分布,其值为零。 不使用自由度。
- 引发:
- ValueError
如果 a 的大小为 0。
注释
describe
除了 NumPy 之外,还实验性地支持 Python Array API Standard 兼容后端。 请考虑通过设置环境变量SCIPY_ARRAY_API=1
并提供 CuPy、PyTorch、JAX 或 Dask 数组作为数组参数来测试这些功能。 支持以下后端和设备(或其他功能)的组合。库
CPU
GPU
NumPy
✅
不适用
CuPy
不适用
✅
PyTorch
✅
✅
JAX
⚠️ 无 JIT
⚠️ 无 JIT
Dask
⚠️ 计算图
不适用
有关更多信息,请参阅对数组 API 标准的支持。
示例
>>> import numpy as np >>> from scipy import stats >>> a = np.arange(10) >>> stats.describe(a) DescribeResult(nobs=10, minmax=(0, 9), mean=4.5, variance=9.166666666666666, skewness=0.0, kurtosis=-1.2242424242424244) >>> b = [[1, 2], [3, 4]] >>> stats.describe(b) DescribeResult(nobs=2, minmax=(array([1, 2]), array([3, 4])), mean=array([2., 3.]), variance=array([2., 2.]), skewness=array([0., 0.]), kurtosis=array([-2., -2.]))