scipy.stats.

directional_stats#

scipy.stats.directional_stats(samples, *, axis=0, normalize=True)[source]#

计算方向数据的样本统计量。

计算向量样本的方向均值（也称为平均方向向量）和平均合长度。

方向均值是向量数据“首选方向”的度量。它类似于样本均值，但用于数据长度无关紧要时（例如，单位向量）。

平均合长度是一个介于 0 和 1 之间的值，用于量化方向数据的离散度：平均合长度越小，离散度越大。在 [1] 和 [2] 中给出了几个涉及平均合长度的方向方差的定义。

参数:

samplesarray_like: 输入数组。必须至少是二维的，并且输入的最后一个轴必须与向量空间的维度相对应。当输入正好是二维时，这意味着数据的每一行都是向量观测值。
axisint, 默认值：0: 计算方向均值的轴。
normalize: boolean, 默认值: True: 如果为 True，则标准化输入以确保每个观测值都是单位向量。如果观测值已经是单位向量，请考虑将其设置为 False 以避免不必要的计算。

返回:

resDirectionalStats

一个包含属性的对象

mean_directionndarray: 方向均值。
mean_resultant_lengthndarray: 平均合长度 [1]。

参见

circmean: 圆形均值；即 2D 角度的方向均值
circvar: 圆形方差；即 2D 角度的方向方差

注释

这使用了 [1] 中的方向均值的定义。假设观测值是单位向量，则计算如下。

mean = samples.mean(axis=0)
mean_resultant_length = np.linalg.norm(mean)
mean_direction = mean / mean_resultant_length

此定义适用于方向数据（即每个观测值的幅度无关紧要的向量数据），但不适用于轴向数据（即每个观测值的幅度和符号无关紧要的向量数据）。

已经提出了几个涉及平均合长度 R 的方向方差的定义，包括 1 - R [1], 1 - R**2 [2], 和 2 * (1 - R) [2]。此函数不选择其中一个，而是返回 R 作为属性 mean_resultant_length，以便用户可以计算他们首选的离散度度量。

参考文献

[1] (1,2,3,4)

Mardia, Jupp. (2000). Directional Statistics (p. 163). Wiley.

[2] (1,2,3,4)

https://en.wikipedia.org/wiki/Directional_statistics

示例

>>> import numpy as np
>>> from scipy.stats import directional_stats
>>> data = np.array([[3, 4],    # first observation, 2D vector space
...                  [6, -8]])  # second observation
>>> dirstats = directional_stats(data)
>>> dirstats.mean_direction
array([1., 0.])

相比之下，向量的常规样本均值会受到每个观测值大小的影响。此外，结果不会是单位向量。

>>> data.mean(axis=0)
array([4.5, -2.])

directional_stats 的一个示例用例是找到球体上的一组观测值（例如，地理位置）的有意义的中心。

>>> data = np.array([[0.8660254, 0.5, 0.],
...                  [0.8660254, -0.5, 0.]])
>>> dirstats = directional_stats(data)
>>> dirstats.mean_direction
array([1., 0., 0.])

另一方面，常规样本均值会产生一个不在球体表面上的结果。

>>> data.mean(axis=0)
array([0.8660254, 0., 0.])

该函数还返回平均合长度，可用于计算方向方差。例如，使用 [2] 中的定义 Var(z) = 1 - R，其中 R 是平均合长度，我们可以计算上述示例中向量的方向方差为

>>> 1 - dirstats.mean_resultant_length
0.13397459716167093