scipy.spatial.cKDTree.

count_neighbors#

cKDTree.count_neighbors(self, other, r, p=2., weights=None, cumulative=True)#

计算可以形成的附近对的数量。

计算可以形成的 (x1,x2) 对的数量，其中 x1 来自 self，x2 来自 other，并且 distance(x1, x2, p) <= r。

可以选择使用 weights 参数对 self 和 other 上的数据点进行加权。（见下文）

这是改编自 Gray 和 Moore [1] 描述的“两点相关”算法。有关进一步讨论，请参见注释。

参数:

othercKDTree 实例: 从中提取点的另一棵树，可以是与 self 相同的树。
r浮点数或浮点数的一维数组: 生成计数的半径。使用单个树遍历搜索多个半径。如果计数是非累积的 (cumulative=False)，则 r 定义 bin 的边缘，并且必须是非递减的。
p浮点数，可选: 1<=p<=infinity。要使用的 Minkowski p-范数。默认值为 2.0。如果可能发生溢出，则有限的大 p 可能会导致 ValueError。
weights元组、类数组或 None，可选: 如果为 None，则配对计数不加权。如果给定为元组，则 weights[0] 是 self 中点的权重，而 weights[1] 是 other 中点的权重；两者都可以为 None 以指示点未加权。如果给定为类数组，则 weights 是 self 和 other 中点的权重。为了使这有意义，self 和 other 必须是同一棵树。如果 self 和 other 是两棵不同的树，则会引发 ValueError。默认值：None
cumulative布尔值，可选: 返回的计数是否为累积计数。当 cumulative 设置为 False 时，该算法经过优化，可用于大量 bin (>10)，由 r 指定。当 cumulative 设置为 True 时，该算法经过优化，可用于少量 r。默认值：True

返回值:

result标量或一维数组: 对的数量。对于未加权计数，结果为整数。对于加权计数，结果为浮点数。如果 cumulative 为 False，则 result[i] 包含计数，其中 (-inf if i == 0 else r[i-1]) < R <= r[i]

说明

配对计数是用于从由对象位置组成的数据集中计算两点相关函数的基本操作。

两点相关函数测量对象的聚类，并广泛用于宇宙学中，以量化我们宇宙中的大规模结构，但它可能对其他领域中的数据分析有用，在这些领域中，对象的自相似组装也会发生。

Landy-Szalay 估计器用于 D 的两点相关函数，测量 D 中的聚类信号。 [2]

例如，给定两组对象的位置，

对象 D (数据) 包含聚类信号，以及
对象 R (随机) 不包含信号，

\[\xi(r) = \frac{<D, D> - 2 f <D, R> + f^2<R, R>}{f^2<R, R>},\]

其中括号表示在 r (距离) 附近的有限 bin 中两个数据集之间的配对计数，对应于设置 cumulative=False，并且 f = float(len(D)) / float(len(R)) 是来自数据和随机对象的数量之比。

此处实现的算法大致基于 [1] 中描述的双树算法。我们根据 cumulative 的设置在两种不同的配对累积方案之间切换。当 cumulative == False 时，我们使用的方法的计算时间不随 bin 总数缩放。 cumulative == True 的算法与 bin 的数量线性缩放，尽管当仅使用 1 或 2 个 bin 时，它会稍微快一些。 [5]。

作为朴素配对计数的扩展，加权配对计数计算权重的乘积而不是配对数量。加权配对计数用于估计标记相关函数（[3]，第 2.2 节），或正确计算每个距离 bin 的数据平均值（例如，[4]，关于红移的第 2.1 节）。

[1] (1,2)

Gray 和 Moore，“统计学习中的 N 体问题”，挖掘天空，2000 年，arXiv:astro-ph/0012333

[2]

Landy 和 Szalay，“角度相关函数的偏差和方差”，《天体物理学杂志》，1993 年，DOI:10.1086/172900

[3]

Sheth、Connolly 和 Skibba，“星系形成模型中的标记相关性”，2005 年，arXiv:astro-ph/0511773

[4]

Hawkins 等人，“2dF 星系红移调查：相关函数、特殊速度和宇宙物质密度”，《皇家天文学会月刊》，2002 年，DOI:10.1046/j.1365-2966.2003.07063.x

[5]

scipy/scipy#5647

示例

您可以计算两个 kd 树在一定距离内的邻居数

>>> import numpy as np
>>> from scipy.spatial import cKDTree
>>> rng = np.random.default_rng()
>>> points1 = rng.random((5, 2))
>>> points2 = rng.random((5, 2))
>>> kd_tree1 = cKDTree(points1)
>>> kd_tree2 = cKDTree(points2)
>>> kd_tree1.count_neighbors(kd_tree2, 0.2)
1

这个数字与 query_ball_tree 计算的总配对数相同

>>> indexes = kd_tree1.query_ball_tree(kd_tree2, r=0.2)
>>> sum([len(i) for i in indexes])
1