此条目没有列出任何参考或来源。 (2020年4月26日) 维基百科所有的内容都应该可供查证。请协助补充可靠来源以改善这篇条目。无法查证的内容可能会因为异议提出而移除。 |
马哈拉诺比斯距离(Mahalanobis distance)是由印度统计学家普拉桑塔·钱德拉·马哈拉诺比斯提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。
对于一个均值为
,协方差矩阵为
的多变量向量
,其马氏距离为

马哈拉诺比斯距离也可以定义为两个服从同一分布并且其协方差矩阵为
的随机变量
与
的差异程度:

如果协方差矩阵为单位矩阵,马哈拉诺比斯距离就简化为欧氏距离;如果协方差矩阵为对角阵,其也可称为正规化的欧氏距离。

其中
是
的标准差。