协方差(英语:Covariance),在概率论与统计学中用于衡量两个随机变量的联合变化程度。
“Covariance”的各地常用译名 |
---|
中国大陆 | 协方差 |
---|
台湾 | 共变异数 |
---|
港澳 | 协方差 |
---|
日本、韩国 | 共分散 |
---|
若变量的较大值主要与另一个变量的较大值相对应,而两者的较小值也相对应,则可称两变量倾向于表现出相似的行为,协方差为正。在相反的情况下,当一个变量的较大值主要对应于另一个变量的较小值时,则两变量倾向于表现出相反的行为,协方差为负。即协方差之正负号显示著变量的相关性。
协方差的数值大小取决于变量大小,因此不易解释。不过,正态形式的协方差大小可以显示两变量线性关系的强弱,可见皮尔逊积矩相关系数。
方差为协方差的一种特殊情况,即该变量与其自身之协方差。
公式
期望值分别为 与 的两个具有有限二阶矩的实数随机变量 与 之间的协方差定义为:
-
协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。
如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。
如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
如果 与 是统计独立的,那么二者之间的协方差就是0,这是因为
-
但是反过来并不成立,即如果 与 的协方差为0,二者并不一定是统计独立的。
取决于协方差的相关性
-
更准确地说是线性相关性,是一个衡量线性独立的无量纲数,其取值在 之间。相关性 时称为“完全线性相关”(相关性 时称为“完全线性负相关”),此时将 对 作Y-X 散点图,将得到一组精确排列在直线上的点;相关性数值介于-1到1之间时,其绝对值越接近1表明线性相关性越好,作散点图得到的点的排布越接近一条直线。
相关性为0(因而协方差也为0)的两个随机变量又被称为是不相关的,或者更准确地说叫作“线性无关”、“线性不相关”,这仅仅表明 与 两随机变量之间没有线性相关性,并非表示它们之间一定没有任何内在的(非线性)函数关系,和前面所说的“ 、 二者并不一定是统计独立的”说法一致。
属性
如果 与 是实数随机变量, 与 是常数,那么根据协方差的定义可以得到:
- ,
- ,
- ,
对于随机变量序列 与 ,有
- ,
对于随机变量序列 ,有
- 。
协方差矩阵
分别为 与 个标量元素的列向量随机变量 与 ,二者对应的期望值分别为 与 ,这两个变量之间的协方差定义为 矩阵
-
两个向量变量的协方差 与 互为转置矩阵。
协方差有时也称为是两个随机变量之间“线性独立性”的度量,但是这个含义与线性代数中严格的线性独立性线性独立不同。
参见