scipy.stats.

describe#

scipy.stats.describe(a, axis=0, ddof=1, bias=True, nan_policy='propagate')[source]#

计算所传递数组的多个描述性统计数据。

参数:
a类似数组

输入数据。

axis整型或 None,可选

计算统计数据的轴。默认为 0。如果为 None,则在整个数组 a 中计算。

ddof整型,可选

自由度增量(仅适用于方差)。默认为 1。

bias布尔型,可选

如果为 False,则偏度和峰度的计算会针对统计偏差进行修正。

nan_policy{‘propagate’, ‘raise’, ‘omit’},可选

定义在输入中包含 nan 时如何处理。可用的选项如下(默认为 ‘propagate’)

  • ‘propagate’:返回 nan

  • ‘raise’:抛出错误

  • ‘omit’:忽略 nan 值执行计算

返回:
nobs整型或整型 ndarray

观察数量(沿 axis 的数据长度)。在将 ‘omit’ 选为 nan_policy 时,分别计数每个轴切片的长度。

minmax:ndarrays 或浮点数的元组

沿给定轴a的最小值和最大值。

均值ndarray 或浮点数

沿给定轴a的算术平均值。

方差ndarray 或浮点数

沿给定轴a的无偏方差;分母是观测值减一。

偏度ndarray 或浮点数

沿给定轴a基于矩计算的偏度,分母等于观测值,即没有自由度的修正。

峰度ndarray 或 float

沿给定轴a的峰度(Fisher)。峰度归一化,使得正态分布的峰度为零。不使用自由度​​。

另请参见

skew, kurtosis

示例

>>> import numpy as np
>>> from scipy import stats
>>> a = np.arange(10)
>>> stats.describe(a)
DescribeResult(nobs=10, minmax=(0, 9), mean=4.5,
               variance=9.166666666666666, skewness=0.0,
               kurtosis=-1.2242424242424244)
>>> b = [[1, 2], [3, 4]]
>>> stats.describe(b)
DescribeResult(nobs=2, minmax=(array([1, 2]), array([3, 4])),
               mean=array([2., 3.]), variance=array([2., 2.]),
               skewness=array([0., 0.]), kurtosis=array([-2., -2.]))