scipy.stats.

cumfreq#

scipy.stats.cumfreq(a, numbins=10, defaultreallimits=None, weights=None)[源代码]#

返回使用直方图函数的累积频率直方图。

累积直方图是一个映射,它计算到指定 bin 为止的所有 bin 中累积的观测数量。

参数
aarray_like

输入数组。

numbinsint,可选

用于直方图的 bin 数量。默认为 10。

defaultreallimitstuple (lower, upper),可选

直方图范围的下限和上限值。 如果未给出值,则使用比 a 中值的范围稍大的范围。 具体来说,(a.min() - s, a.max() + s),其中 s = (1/2)(a.max() - a.min()) / (numbins - 1)

weightsarray_like,可选

a 中每个值的权重。 默认为 None,这为每个值赋予权重 1.0

返回
cumcountndarray

累积频率的 bin 值。

lowerlimitfloat

下限实值

binsizefloat

每个 bin 的宽度。

extrapointsint

额外点。

示例

>>> import numpy as np
>>> import matplotlib.pyplot as plt
>>> from scipy import stats
>>> rng = np.random.default_rng()
>>> x = [1, 4, 2, 1, 3, 1]
>>> res = stats.cumfreq(x, numbins=4, defaultreallimits=(1.5, 5))
>>> res.cumcount
array([ 1.,  2.,  3.,  3.])
>>> res.extrapoints
3

创建一个包含 1000 个随机值的正态分布

>>> samples = stats.norm.rvs(size=1000, random_state=rng)

计算累积频率

>>> res = stats.cumfreq(samples, numbins=25)

计算 x 值的空间

>>> x = res.lowerlimit + np.linspace(0, res.binsize*res.cumcount.size,
...                                  res.cumcount.size)

绘制直方图和累积直方图

>>> fig = plt.figure(figsize=(10, 4))
>>> ax1 = fig.add_subplot(1, 2, 1)
>>> ax2 = fig.add_subplot(1, 2, 2)
>>> ax1.hist(samples, bins=25)
>>> ax1.set_title('Histogram')
>>> ax2.bar(x, res.cumcount, width=res.binsize)
>>> ax2.set_title('Cumulative histogram')
>>> ax2.set_xlim([x.min(), x.max()])
>>> plt.show()
../../_images/scipy-stats-cumfreq-1.png