作业帮 > 数学 > 作业

协方差为什么可以表示出两变量之间的相关程度?

来源:学生作业帮 编辑:灵鹊做题网作业帮 分类:数学作业 时间:2024/05/04 15:08:15
协方差为什么可以表示出两变量之间的相关程度?
我知道公式,但是不明白它跟两变量之间的相关程度有什么关系.
协方差为什么可以表示出两变量之间的相关程度?
相关关系是这样的:
首先考虑以X的线性函数a+bX来近似表示y,以均方误差(e)来衡量(a+bx)接近y的好坏程度.
均方误差的定义是这样的:
e=E[(y-(a+bx))^2〕=E(y^2)+b^2*E(x^2)+a^2-2bE(xy)+2abE(x)-2aE(y)
e的值越小,表示(a+bx)与y的近似程度越好.
e是|ρxy|的严格单调减少的函数,这样ρxy的含义就明显了:当|ρxy|较大时e较小,表明x,y(就线性关系来说)联系较紧密.特别当|ρxy|=1时,由以下定理可知x与y之间以概率1存在着线性关系.
定理:|ρxy|=1的充要条件是,存在常数a,b使 P{y=a+bx}=1成立.
于是|ρxy|是一个可以用来表征x,y之间线性关系紧密程序的量.当|ρxy|较大时,我们通常说x,y之间的线性相关的程度较好;当|ρxy|较小时,我们说x,y线性相关程度较差.
特别地,当|ρxy|=0时, 称x与y不相关.
好了,明白了什么是相关性后,我们再来看协方差和相关系数|ρxy|之间的关系.
COV(X,Y)=ρxy*sqrt(D(X))*sqrt(D(Y)),这个公式亦即:ρxy=COV(X,Y)/(sqrt(D(X))*sqrt(D(Y))),很显然,协方差和|ρxy|是紧密联系的.协方差的变化就能反映ρxy的变化.
不知你明白不,我尽力了.