skew#
- scipy.stats.skew(a, axis=0, bias=True, nan_policy='propagate', *, keepdims=False)[源代码]#
计算数据集的样本偏度。
对于正态分布的数据,偏度应该接近于零。对于单峰连续分布,偏度值大于零意味着分布的右尾权重更大。函数
skewtest
可以用来确定偏度值是否在统计学上足够接近于零。- 参数:
- andarray
输入数组。
- axisint 或 None, 默认值: 0
如果是一个整数,则表示输入数组中计算统计量的轴。输入数组的每个轴切片(例如,行)的统计量将出现在输出的对应元素中。如果为
None
,则在计算统计量之前将输入展平。- biasbool, 可选
如果为 False,则计算会进行统计偏差校正。
- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定义如何处理输入中的 NaN。
propagate
: 如果在计算统计量的轴切片(例如,行)中存在 NaN,则输出的相应条目将为 NaN。omit
: 执行计算时将忽略 NaN。如果计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。raise
: 如果存在 NaN,则会引发ValueError
。
- keepdimsbool, 默认值: False
如果设置为 True,则被缩减的轴将保留在结果中,大小为 1。使用此选项,结果将与输入数组正确广播。
- 返回:
- skewnessndarray
沿轴的值的偏度,如果所有值都相等,则返回 NaN。
注释
样本偏度计算为 Fisher-Pearson 偏度系数,即
\[g_1=\frac{m_3}{m_2^{3/2}}\]其中
\[m_i=\frac{1}{N}\sum_{n=1}^N(x[n]-\bar{x})^i\]是带偏差的样本 \(i\texttt{th}\) 中心矩,而 \(\bar{x}\) 是样本均值。如果
bias
为 False,则计算会进行偏差校正,计算的值是调整后的 Fisher-Pearson 标准化矩系数,即\[G_1=\frac{k_3}{k_2^{3/2}}= \frac{\sqrt{N(N-1)}}{N-2}\frac{m_3}{m_2^{3/2}}.\]从 SciPy 1.9 开始,
np.matrix
输入(不建议用于新代码)在执行计算之前会转换为np.ndarray
。在这种情况下,输出将是一个标量或具有适当形状的np.ndarray
,而不是二维的np.matrix
。类似地,虽然会忽略掩码数组的掩码元素,但输出将是一个标量或np.ndarray
,而不是mask=False
的掩码数组。参考文献
[1]Zwillinger, D. 和 Kokoska, S. (2000). CRC 标准概率和统计表和公式。Chapman & Hall: 纽约。2000 年。第 2.2.24.1 节。
示例
>>> from scipy.stats import skew >>> skew([1, 2, 3, 4, 5]) 0.0 >>> skew([2, 8, 0, 4, 1, 9, 9, 0]) 0.2650554122698573