scipy.spatial.distance.

jensenshannon#

scipy.spatial.distance.jensenshannon(p, q, base=None, *, axis=0, keepdims=False)[源代码]#

计算两个概率数组之间的 Jensen-Shannon 距离(度量)。 这是 Jensen-Shannon 散度的平方根。

两个概率向量 pq 之间的 Jensen-Shannon 距离定义为:

\[\sqrt{\frac{D(p \parallel m) + D(q \parallel m)}{2}}\]

其中 \(m\)\(p\)\(q\) 的逐点平均值,\(D\) 是 Kullback-Leibler 散度。

如果 pq 的总和不为 1.0,则此例程将对其进行归一化。

参数:
p(N,) 类似数组

左概率向量

q(N,) 类似数组

右概率向量

basedouble,可选

用于计算输出的对数的底数,如果未给出,则例程使用 scipy.stats.entropy 的默认底数。

axisint,可选

计算 Jensen-Shannon 距离的轴。 默认值为 0。

1.7.0 版本新增。

keepdimsbool,可选

如果将其设置为 True,则减小的轴将保留在结果中,作为大小为 1 的维度。 使用此选项,结果将针对输入数组正确广播。 默认值为 False。

1.7.0 版本新增。

返回:
jsdouble 或 ndarray

沿 axispq 之间的 Jensen-Shannon 距离。

注释

1.2.0 版本新增。

示例

>>> from scipy.spatial import distance
>>> import numpy as np
>>> distance.jensenshannon([1.0, 0.0, 0.0], [0.0, 1.0, 0.0], 2.0)
1.0
>>> distance.jensenshannon([1.0, 0.0], [0.5, 0.5])
0.46450140402245893
>>> distance.jensenshannon([1.0, 0.0, 0.0], [1.0, 0.0, 0.0])
0.0
>>> a = np.array([[1, 2, 3, 4],
...               [5, 6, 7, 8],
...               [9, 10, 11, 12]])
>>> b = np.array([[13, 14, 15, 16],
...               [17, 18, 19, 20],
...               [21, 22, 23, 24]])
>>> distance.jensenshannon(a, b, axis=0)
array([0.1954288, 0.1447697, 0.1138377, 0.0927636])
>>> distance.jensenshannon(a, b, axis=1)
array([0.1402339, 0.0399106, 0.0201815])