您当前的位置:首页 > IT编程 > python
| C语言 | Java | VB | VC | python | Android | TensorFlow | C++ | oracle | 学术与代码 | cnn卷积神经网络 | gnn | 图像修复 | Keras | 数据集 | Neo4j | 自然语言处理 | 深度学习 | 医学CAD | 医学影像 | 超参数 | pointnet | pytorch | 异常检测 | Transformers | 情感分类 | 知识图谱 |

自学教程:Python 马氏距离求取函数详解

51自学网 2022-02-21 10:48:22
  python
这篇教程Python 马氏距离求取函数详解写得很实用,希望能帮到您。

马氏距离区别于欧式距离,如百度知道中所言:

马氏距离(Mahalanobis distance)是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示点与一个分布之间的距离。它是一种有效的计算两个未知样本集的相似度的方法。与 欧氏距离不同的是,它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的),并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为μ, 协方差矩阵为Σ的多变量向量,其马氏距离为sqrt( (x-μ)'Σ^(-1)(x-μ) )。

因此,对于马氏距离最终的定义式为:

上代码,将马氏距离求取式,封装为Python函数,拷贝即可使用:

from numpy import *import numpydef get_mahalanobis(x, i, j):    xT = x.T  # 求转置    D = numpy.cov(xT)  # 求协方差矩阵    invD = numpy.linalg.inv(D)  # 协方差逆矩阵    assert 0 <= i < x.shape[0], "点 1 索引超出样本范围。"    assert -1 <= j < x.shape[0], "点 2 索引超出样本范围。"    x_A = x[i]    x_B = x.mean(axis=0) if j == -1 else x[j]    tp = x_A - x_B    return numpy.sqrt(dot(dot(tp, invD), tp.T))

使用方式如下:

if __name__ == '__main__':    # 初始化数据点集,或者从其它地方加载    x = numpy.array([[3, 4], [5, 6], [2, 2], [8, 4]])    # 求第0个点到均值之间的马氏距离(j为-1时代表均值)    print(get_mahalanobis(x, 0, -1))    # 求第0个点到第1个点之间的马氏距离    print(get_mahalanobis(x, 0, 1))    # 求第2个点到第3个点之间的马氏距离(索引从0开始算起)    print(get_mahalanobis(x, 2, 3))

运行结果贴图

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注51zixue.net的更多内容!


Python 图片文字识别的实现之PaddleOCR
Python Matplotlib初阶使用入门教程
万事OK自学网:51自学网_软件自学网_CAD自学网自学excel、自学PS、自学CAD、自学C语言、自学css3实例,是一个通过网络自主学习工作技能的自学平台,网友喜欢的软件自学网站。