scipy.stats.random_table#
- scipy.stats.random_table = <scipy.stats._multivariate.random_table_gen object>[source]#
具有固定边缘和的独立样本列联表。
这是具有给定行和列向量和的随机表的分布。此分布表示行列相互独立的零假设下的随机表集。它用于独立性的假设检验中。
由于假定独立,可以根据行和和列和来计算每个表格元素的预期频率,因此该分布完全由这两个向量决定。
- 参数:
- 行array_like
每行中表条目的总和。
- 列array_like
每列中表条目的总和。
- 种子{None, int, np.random.RandomState, np.random.Generator},可选
用于绘制随机变量。如果种子是None,则使用RandomState单例。如果种子是整数,则使用新的
RandomState
实例,并使用种子播种。如果种子已经是RandomState
或Generator
实例,则使用该对象。默认值为None。
注意
行和列向量必须是一维的、非空的且每个向量和的总和相等。它们不能包含负数或非整型条目。
从分布中生成的随机元素要么使用 Boyett 的 [1] 算法要么使用 Patefield 的算法 [2]。Boyett 的算法具有 O(N) 时间和空间复杂度,其中 N 是表格中条目的总和。Patefield 的算法具有 O(K x log(N)) 时间复杂度,其中 K 是表格中的单元格数量,并且只需要一个小的常数工作空间。默认情况下,rvs 方法基于输入选择最快的算法,但你可以使用关键字 method 指定算法。允许的值为“boyett”和“patefield”。
在 1.10.0 版中添加。
参考文献
[1]Boyett, AS 144 Appl. Statist. 28 (1979) 329-332
[2]W.M. Patefield, AS 159 Appl. Statist. 30 (1981) 91-97
示例
>>> from scipy.stats import random_table
>>> row = [1, 5] >>> col = [2, 3, 1] >>> random_table.mean(row, col) array([[0.33333333, 0.5 , 0.16666667], [1.66666667, 2.5 , 0.83333333]])
或者,可以调用对象(作为函数)来修复行和列向量和,返回一个“冻结”的分布。
>>> dist = random_table(row, col) >>> dist.rvs(random_state=123) array([[1., 0., 0.], [1., 3., 1.]])
方法
logpmf(x)
表 x 在分布中出现的对数概率。
pmf(x)
表 x 在分布中出现的概率。
mean(row, col)
均值表。
rvs(row, col, size=None, method=None, random_state=None)
绘制具有给定行和列向量和的随机表。