scipy.stats.f#
- scipy.stats.f = <scipy.stats._continuous_distns.f_gen object>[source]#
一个 F 连续随机变量。
对于非中心 F 分布,请参阅
ncf
。作为一个
rv_continuous
类的实例,f
对象从它继承了一集合通用方法(有关完整列表请参见下文),并用此特定分布的详细信息对其进行补充。另请参阅
备注
当自由度 \(df_1 > 0\) 和 \(df_2 > 0\) 时,F 分布是两个自由度分别为 \(df_1\) 和 \(df_2\) 的独立卡方分布的比值分布,在乘以 \(df_2 / df_1\) 进行重放之后。
对于
f
的概率密度函数为\[f(x, df_1, df_2) = \frac{df_2^{df_2/2} df_1^{df_1/2} x^{df_1 / 2-1}} {(df_2+df_1 x)^{(df_1+df_2)/2} B(df_1/2, df_2/2)}\]对于 \(x > 0\)。
f
接受形状参数dfn
和dfd
作为 \(df_1\)(分子中卡方分布的自由度),以及 \(df_2\)(分母中卡方分布的自由度)。以上的概率密度以“标准化”的形式进行定义。要平移和/或缩放分布,可以使用
loc
和scale
参数。具体而言,f.pdf(x, dfn, dfd, loc, scale)
与f.pdf(y, dfn, dfd) / scale
完全相等,其中y = (x - loc) / scale
。请注意,平移分布的位置并不会使其变为“非中心”分布;某些分布的非中心泛化形式可在单独的类中获取。示例
>>> import numpy as np >>> from scipy.stats import f >>> import matplotlib.pyplot as plt >>> fig, ax = plt.subplots(1, 1)
计算前四个矩
>>> dfn, dfd = 29, 18 >>> mean, var, skew, kurt = f.stats(dfn, dfd, moments='mvsk')
显示概率密度函数 (
pdf
)>>> x = np.linspace(f.ppf(0.01, dfn, dfd), ... f.ppf(0.99, dfn, dfd), 100) >>> ax.plot(x, f.pdf(x, dfn, dfd), ... 'r-', lw=5, alpha=0.6, label='f pdf')
或者,可以调用分布对象(作为函数)来修正形状、位置和规模参数。这会返回一个“冻结”的 RV 对象,其中固定了给定的参数。
冻结分布并显示冻结的
pdf
>>> rv = f(dfn, dfd) >>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')
检查
cdf
和ppf
的准确性>>> vals = f.ppf([0.001, 0.5, 0.999], dfn, dfd) >>> np.allclose([0.001, 0.5, 0.999], f.cdf(vals, dfn, dfd)) True
生成随机数
>>> r = f.rvs(dfn, dfd, size=1000)
并比较直方图
>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2) >>> ax.set_xlim([x[0], x[-1]]) >>> ax.legend(loc='best', frameon=False) >>> plt.show()
方法
rvs(dfn, dfd, loc=0, scale=1, size=1, random_state=None)
随机变量。
pdf(x, dfn, dfd, loc=0, scale=1)
概率密度函数。
logpdf(x, dfn, dfd, loc=0, scale=1)
概率密度函数的对数。
cdf(x, dfn, dfd, loc=0, scale=1)
累积分布函数。
logcdf(x, dfn, dfd, loc=0, scale=1)
累积分布函数的对数。
sf(x, dfn, dfd, loc=0, scale=1)
生存函数(也定义为
1 - cdf
,但是 sf 有时更准确)。logsf(x, dfn, dfd, loc=0, scale=1)
生存函数的对数。
ppf(q, dfn, dfd, loc=0, scale=1)
百分点函数(
cdf
的反函数 — 百分数)。isf(q, dfn, dfd, loc=0, scale=1)
逆生存函数(
sf
的反函数)。moment(order, dfn, dfd, loc=0, scale=1)
指定顺序的非中心距。
stats(dfn, dfd, loc=0, scale=1, moments=’mv’)
均值('m'),方差('v'),偏度('s')和/或峰度('k')。
entropy(dfn, dfd, loc=0, scale=1)
随机变量的(微分)熵。
fit(data)
通用数据的参数估值。请参阅 scipy.stats.rv_continuous.fit,以获得关键字参数的详细说明。
expect(func, args=(dfn, dfd), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)
根据分布的一个函数(一个参数)的期望值。
median(dfn, dfd, loc=0, scale=1)
分布的中位数。
mean(dfn, dfd, loc=0, scale=1)
分布的均值。
var(dfn, dfd, loc=0, scale=1)
分布的方差。
std(dfn, dfd, loc=0, scale=1)
分布的标准差。
interval(confidence, dfn, dfd, loc=0, scale=1)
中位数周围具有相等面积的置信区间。