相关系数2_图文


复习回顾
* 用线性回归方程进行回归分析: (1)画散点图;

(2)求回归系数 a, b :
b?

?(x
i ?1 n

n

i

? x )( yi ? y )

( xi ? x ) 2 ?
i ?1

?

?x y
i ?1 n i i ?1

n

i

? nx y

xi2 ? nx 2 ?

a ? y ? bx

(3)写回归直线方程 y ? a ? bx,并用方程进 行预测说明。

任何数据都可以求线性回归方程,求之前通常先 判断变量的线性相关关系-----作出散点图,但有时从 图中也不易判断出线性关系,另外,如果数据量较大

时,不易画图,需另想办法。
为解决这个问题,我们可通过计算线性相关系数

r,来判断变量间相关程度的大小,计算公式为:
r? l xy l xxl yy ?

?(x
i ?1 n i ?1

n

i

? x )( yi ? y )
2

? ( xi ? x )

? ( yi ? y )
i ?1

n

?
2

?x y
i ?1 i

n

i

? nx y yi2 ? ny 2 ?
i ?1 n

? x ? nx
i ?1 2 i

n

2

据前面的分析,回归系数 a, b 使得误差
Q( a, b) ? ? ? y i ? ( a ? bxi )?
n i ?1 2 2

? l yy ? n? y ? ( a ? bx )? ? l xx (b ?

l xy l xx

)2 ?

2 l xy

的最小值为:
Q(a, b) ? l yy ?
2 lxy

l xx

lxx

? l yy (1 ?

2 lxy

lxxlxx

) ? l yy (1 ? r 2 )

Q ? 0知 r 2 ? 1 ,即 ? 1 ? r ? 1 ,则 由

r?0

r 值越大,误差 Q 越小,则变量的线性相关程度

就越高; r 值越接近于0,Q 越大,线性相关程度就
越低。 相关系数r的性质

当 r ? 0 时, b ? 0 ,两变量的值总体上呈现同 时增加的趋势,则称两变量正相关;

当 r ? 0 时, b ? 0 ,一变量增加,另一变量有
减小的趋势,则称两变量负相关; 当 r ? 0 时,则称两变量线性不相关。

对于上节课给出的例题,变量的线性相关系数r 如何求? 我们知道,相关系数的计算公式为:
r?

?x y
i ?1 i

n

i

? nx y yi2 ? ny 2 ?
i ?1
n
n n

xi2 ? nx 2 ?
i ?1

n

n

要求r,只需求出相关的量:? xi yi , x ,? yi2 , ?
i ?1
i ?1 2 i i ?1

x 和 y 。

由数据表,经过计算,可知:
2 2 xi yi ? 20040 ? xi ? 17633 , ? yi ? 22790, ? ,
i ?1
i ?1

n

n

n

i ?1

330 291 ? 66 ,可得 x? ? 58.2 , y ? 5 5

r?

20040? 5 ? 58.2 ? 66

17633? 5 ? 58.2 2 22790? 5 ? 662
这能说明什么??

? 0.9941

这说明肱骨 y 和股骨

x 有较强的线性相关程度。

计算下表变量的线性相关系数r。

并观察,通过计算可以发现什么? 解析: 根据数据列表计算如下:

i
1 2 3 4 5 6 7

xi
-5 -4 -3 0 3 4 5 0

yi
0 3 4 5 4 3 0 19

x

2 i

yi2
0 9 16 25 16 9 0 75

xi yi
0 -12 -12 0 12 12 0 0

25 16 9 0 9 16 25 100

?

由表可知:
xi2 ? 100 , ? yi2 ? 75 ,? xi yi ? 0 , ?
n
n

n

i ?1

i ?1

i ?1

x ? 0 ,y ? 2.71,则可得
r? 0 ? 7 ? 0 ? 2.71 100? 7 ? 0 2 75 ? 7 ? 2.712 ?0

你发现什么了?? r=0,则变量间并不存在线性相关关系。即此时 建立线性回归方程是没有意义的。

实际上,从散点图上我们也可以验证这一点:

易看出,几个样本点都落在同一个半圆上,而不 是条状分布,此时建立线性回归方程无任何意义,这 与相关系数r的计算结果相一致。

动手做一做
在英语教学中,为了了解学生的词汇量,老师设 计了一份包含100个单词的试卷,现抽取15名学生进 行测试,得到学生掌握试卷单词个数x与该生实际掌 握单词量y的对应数据如下:

对变量y与x进行相关性检验,并写出y对x的回归 直线方程。

小结
* 线性相关系数r:
r?

?x y
i ?1 i

n

i

? nx y yi2 ? ny 2 ?
i ?1 n

,其中 ? 1 ? r ? 1 。

? x ? nx
i ?1 2 i

n

2

* r 值越大,误差 Q 越小,则变量的线性相关程度

就越高; r 值越接近于0,Q 越大,线性相关程度就
越低。

* 当 r ? 0 时,两变量正相关;当 r ? 0 时,两变量 负相关;当 r ? 0 时,两变量线性不相关。

相关系数r越大,变量间的线性关系就越强, 那么r的值究竟大到什么程度就认为线性关系较 强??


相关文档

二次函数字母系数及相关式子符号的判断
1.2相关系数
2相关系数
点二列相关系数
实验二相关系数
矩 协方差和相关系数4-2
1.2相关系数(北师大版选修1-2)
斯皮尔曼等级相关系数二
3.1.2相关系数ppt课件
最小二乘法 相关系数 excel
电脑版