scipy.stats.irwinhall#
- scipy.stats.irwinhall = <scipy.stats._continuous_distns.irwinhall_gen object>[source]#
一个 Irwin-Hall(Uniform Sum)连续随机变量。
一个 Irwin-Hall 连续随机变量是 \(n\) 个独立标准均匀随机变量的和 [1] [2]。
作为
rv_continuous
类的实例,irwinhall
对象从它继承了一组通用方法(参见下表完整列表),并用此特定分布的详细信息对其进行补充。注释
应用包括 Rao 间距检验,当数据不是单峰时,这是一种比瑞利检验更有效的替代方法,以及雷达 [3]。
方便的是,pdf 和 cdf 是均匀分布的标准 pdf 和 cdf 的 n 倍卷积,这也是均匀分布的标准 pdf 和 cdf 的 n 倍卷积,这也是等级为 \(n-1\) 的基数 B 样条的定义,其结点均匀分布在 \(1\) 到 \(n\) [4] [5]。
贝茨分布表示统计独立、均匀分布的随机变量的均值,它只是由 \(1/n\) 缩放的欧文-霍尔分布。例如,冻结分布
bates = irwinhall(10, scale=1/10)
表示 10 个均匀分布的随机变量均值的分布。以上概率密度定义为“标准化”形式。若要平移和/或缩放分布,请使用
loc
和scale
参数。具体来说,irwinhall.pdf(x, n, loc, scale)
与irwinhall.pdf(y, n) / scale
完全等价,其中y = (x - loc) / scale
。请注意,平移分布的位置并不会使其成为“非中心”分布;一些分布的非中心广义分布可用作单独的类。参考文献
[1]P. Hall,“从 0 到 1 区间取值的总体中抽取大小为 N 的样本均值分布,其中所有这些值都同样可能”,生物统计学,第 19 卷,第 3-4 期,1927 年 12 月,240-244 页,DOI:10.1093/biomet/19.3-4.240。
[2]J. O. Irwin,“关于从具有任意有限矩频数分布的总体中抽取的样本均值的频数分布,特别是关于皮尔逊 II 型,生物统计学,第 19 卷,第 3-4 期,1927 年 12 月,第 225-239 页,DOI:0.1093/biomet/19.3-4.225。
[3]K. Buchanan、T. Adeyemi、C. Flores-Molina、S. Wheeland 和 D. Overturf,“分布式天线阵列的旁瓣行为和带宽特性”,2018 年美国无线电科学会议美国国家委员会(USNC-URSI NRSM),科罗拉多州博尔德,美国,2018 年,第 1-2 页。 https://www.usnc-ursi-archive.org/nrsm/2018/papers/B15-9.pdf。
[4]Amos Ron,“Lecture 1:基数 B 样条和卷积算子”,第 1 页 https://pages.cs.wisc.edu/~deboor/887/lec1new.pdf。
[5]Trefethen,N. (2012 年 7 月)。B 样条和卷积。Chebfun。2024 年 4 月 30 日从 http://www.chebfun.org/examples/approx/BSplineConv.html 检索。
示例
>>> import numpy as np >>> from scipy.stats import irwinhall >>> import matplotlib.pyplot as plt >>> fig, ax = plt.subplots(1, 1)
计算前四个矩
>>> n = 10 >>> mean, var, skew, kurt = irwinhall.stats(n, moments='mvsk')
显示概率密度函数 (
pdf
)>>> x = np.linspace(irwinhall.ppf(0.01, n), ... irwinhall.ppf(0.99, n), 100) >>> ax.plot(x, irwinhall.pdf(x, n), ... 'r-', lw=5, alpha=0.6, label='irwinhall pdf')
或者,可以调用分布对象(作为函数)来修复形状、位置和尺度参数。这会返回一个冻结的 RV 对象,固定给定的参数。
冻结分布并显示冻结的
pdf
>>> rv = irwinhall(n) >>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')
检查
cdf
和ppf
的准确性>>> vals = irwinhall.ppf([0.001, 0.5, 0.999], n) >>> np.allclose([0.001, 0.5, 0.999], irwinhall.cdf(vals, n)) True
生成随机数
>>> r = irwinhall.rvs(n, size=1000)
并比较直方图
>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2) >>> ax.set_xlim([x[0], x[-1]]) >>> ax.legend(loc='best', frameon=False) >>> plt.show()
方法
rvs(n, loc=0, scale=1, size=1, random_state=None)
随机变量。
pdf(x, n, loc=0, scale=1)
概率密度函数。
logpdf(x, n, loc=0, scale=1)
概率密度函数的对数。
cdf(x, n, loc=0, scale=1)
累积分布函数。
logcdf(x, n, loc=0, scale=1)
累积分布函数的对数。
sf(x, n, loc=0, scale=1)
生存函数(也定义为
1 - cdf
,但是 sf 有时更准确)。logsf(x, n, loc=0, scale=1)
生存函数的对数。
ppf(q, n, loc=0, scale=1)
百分位函数(
cdf
的反函数 - 百分位数)。isf(q, n, loc=0, scale=1)
逆生存函数(
sf
的反函数)。moment(order, n, loc=0, scale=1)
指定阶数的非中心矩。
stats(n, loc=0, scale=1, moments=’mv’)
均值(“m”)、方差(“v”)、偏度(“s”)和/或峰度(“k”)。
entropy(n, loc=0, scale=1)
RV 的(微分)熵。
fit(data)
针对一般数据进行参数估计。有关关键字参数的详细说明,请参阅 scipy.stats.rv_continuous.fit。
expect(func, args=(n,), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)
针对分布按函数(一个自变量)进行的期望值。
median(n, loc=0, scale=1)
分布的中值。
mean(n, loc=0, scale=1)
分布的均值。
var(n, loc=0, scale=1)
分布的方差。
std(n, loc=0, scale=1)
分布的标准差。
interval(confidence, n, loc=0, scale=1)
以中值为中心的相等区域的置信区间。