2.3 变量间的相关关系
一、学习目标:1.理解两个变量的相关关系的概念
2.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观判断两个变量之间是否具有相关关系;
3. 知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二、学习重点、难点:
1重点:作出散点图和根据给出的线性回归方程系数公式建立线性回归方程。 2.难点:对最小二乘法的理解。 三、学习方法:探究、合作、交流 四、学习过程:
〖创设情境〗
1、函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一 定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系
2、在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问 题。”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成 绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?
3、“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的 教学水平之间的关系是函数关系吗? (一).相关关系
(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的________性,那么这两个变量之间的关系,叫做相关关系.
(2)两类特殊的相关关系:如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为负相关.
[归纳总结] 两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系. (二).线性相关
(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条________附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做_________.
^^^
(2)最小二乘法:求线性回归直线方程y=bx+a时,使得样本数据的点到它的________________最小的方法叫做最小二乘法,其中a,b的值由以下公式给出:
n
(xi)(yi)
bi1
n
(xi)2
i1
ab.
xy
i
i1
n
n
i
n,
i1
xin2
2
1
其中=
n
i1
n
1
xi,=
n
y
i1
n
i
,a为回归方程的斜率,b为截距。
预习自测:
1.下列语句所表示的事件中的因素不具有相关关系的是( ) A.瑞雪兆丰年 B.上梁不正下梁歪 C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧 [答案] D
[解析] 选项A,B,C中描述的变量间都具有相关关系,而选项D是迷信说法,没有科学依据.
[规律总结] 函数关系是一种确定性关系,相关关系是一种非确定性关系,判断两个变量间的关系是否为相关关系的关键是看这个关系是否具有不确定性.
2.观察下列散点图,①正相关,②负相关,③不相关,与下列图形相对应的是( )
A.①②③ [答案] D
B.②③① C.②①③ D.①③②
^^^
3.下列有关回归方程y=bx+a的叙述正确的是( )
^
①反映y与x之间的函数关系; ②反映y与x之间的函数关系; ^
③表示y与x之间的不确定关系;
④表示最接近y与x之间真实关系的一条直线. A.①② B.②③ C.③④ D.①④
^^^^
[解析] y=bx+a表示y与x之间的函数关系,而不是y与x之间的函数关系.但它所反映的关系最接近y与x之间的真实关系.故选D.
[规律总结] 回归直线是对原数量关系的一种拟合,如果两个变量不具有线性相关关系,即使求出回归方程也是毫无意义的,而且由其得到估计和预测的值也是不可信的.
^
4.回归直线方程y=bx+a必经过( )
A.(0,0) B.(x,0) C.(0,y) D.(x,y)
(三)、精讲精练
探究一:变量之间的相关关系的判断
例一(1)下列变量之间的关系不是相关关系的是( )
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率
D.每亩田施肥量和粮食亩产量
(2)现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如下:
请利用散点图判断这10名学生的两次数学考试成绩是否具有相关关系. [探究] 1.判断两个变量之间具有相关关系的关键是什么?
2.利用散点图判断两个变量是否具有相关关系的依据是什么?
[解析] (1)在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确这了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.故选A. (2)两次数学考试成绩散点图如图所示,
由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系.因此,这10名学生的两次数学考试成绩具有相关关系. [答案] (1)A
[规律总结] 两个变量x与y相关关系的判断方法:
(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
(2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
[特别提醒] 如果所有的样本点都落在某一函数曲线附近,那么变量之间就有相关关系. 变式一:对变量x,y有观测数据(xi,yi)(i=1,2,„,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,„,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 [答案] C
[解析] 图(1)中的数据y随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据随着u的增大,v也增大,因此u与v正相关. 探究二、回归直线方程 例二:随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用
^^^^^
(1)线性回归方程y=bx+a的回归系数a、b;
(2)估计使用年限为10年时,车的使用总费用是多少? [探究] 第一步,列表xi,yi,xiyi; --n2n2n
第二步,计算x,y,xi,yi,xiyi;
i=1
i=1
i=1
第三步,代入公式计算b,a的值; 第四步,写出回归直线方程. (1)利用公式:
b=
x--x^--a=y-b x,
n^
i=1
ni=1^
i
--
xi-xyi-y
=
2
i=1
--
xiyi-n x yxi2-nx2i=1
n
-
n
来计算回归系数.有时为了方便常列
表,对应列出xiyi、x2i,以利于求和.(2)获得线性回归方程后,取x=10,即得所求. [
于是b=
1.23; 1090-5×4^--
a=y-bx=5-1.23×4=0.08.
^^
(2)线性回归直线方程是y=1.23x+0.08,当x=10(年)时,y=1.23×10+0.08=12.38(万元),即估计使用10年时,支出总费用是12.38万元.
[规律总结] 求回归直线方程的一般步骤:
①收集样本数据,设为(xi,yi),(i=1,2,„,n)(数据一般由题目给出). ②作出散点图,确定x,y具有线性相关关系. ③把数据制成表格xi,yi,x2i,xiyi. ④计算x,y
n
2
,xi,xiyi, i=1i=1
n
xy-nxy
b^
代入公式计算b,a,公式为x-nx
^
a=y-bx.
n
--
^
i=1n
ii
^
i=1
2i
-
2
^-
^^^
⑥写出回归直线方程y=bx+a.
变式二:(1)(2015·石家庄高二检测)已知回归直线的斜率的估计值是1.23,样本点中心(即(x,y))为(4,5),则回归直线的方程是( )
^^^^
A.y=1.23x+4 B.y=1.23x+5 C.y=1.23x+0.08 D.y=0.08x+1.23
(2)某公司的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
^^^^
资料显示y对x呈线性相关关系.根据上表提供的数据得到回归方程y=bx+a中的b=6.5,预测销售额为115万元时约需________万元广告费.
[答案] (1)C (2)15
^^
[解析] (1)由题意知,可设此回归直线的方程为y=1.23x+a,又因为回归直线必过点(x,^^^^
y),所以点(4,5)在直线y=1.23x+a上,所以5=1.23×4+a,a=0.08,
^
故回归直线的方程是y=1.23x+0.08.
2+4+5+6+830+40+60+50+70
(2)x==5,y==50.
55^^^
因为回归方程过样本中心(5,50),代入y=6.5x+a,得a=17.5, ^
所以y=6.5x+17.5,
(四)【课堂小结】
1、求样本数据的线性回归方程,可按下列步骤进行:
(1)计算平均数,; (2)求a,b; (3)写出回归直线方程。
2、回归方程被样本数据惟一确定,对同一个总体,不同的样本数据对应不同的回归直线,所以回归
直线也具有随机性.。
3、对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关 关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的。因此,对一组样本数据, 应先作散点图,在具有线性相关关系的前提下再求回归方程。
〖书面作业〗(14新课标2理)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)⑴求y关于t的线性回归方程;
⑵利用⑴中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别
为:b
ty
i
i
i1
n
ti
i1
n
2
ˆ ˆ,a
【解析】
(1)t
1272.93.33.64.44.85.25.9
4,y4.377
设回归方程为ybta,代入公式,经计算得3*1420.700.51.84.8141b,
(941)*214*221
ay-bt4.3-*42.3
2
所以,y关于t的回归方程为y0.5t2.3.
(2)b
1
0,∴2007年至2013年该区人均纯收入稳步增长,预计到2015年,2
该区人均纯收入y0.592.36.8(千元) 所以,预计到2015年,该区人均纯收入约6千8百元左右。
〖板书设计〗
教学反思:本节课主要是理解与掌握两个变量的相关关系的概念,通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观判断两个变量之间是否具有相关关系;知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。学生基本能够掌握,能明确高考考试方向,但学生在计算方面要进一步加强
2.3 变量间的相关关系
一、学习目标:1.理解两个变量的相关关系的概念
2.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观判断两个变量之间是否具有相关关系;
3. 知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二、学习重点、难点:
1重点:作出散点图和根据给出的线性回归方程系数公式建立线性回归方程。 2.难点:对最小二乘法的理解。 三、学习方法:探究、合作、交流 四、学习过程:
〖创设情境〗
1、函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一 定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系
2、在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问 题。”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成 绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?
3、“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的 教学水平之间的关系是函数关系吗? (一).相关关系
(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的________性,那么这两个变量之间的关系,叫做相关关系.
(2)两类特殊的相关关系:如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为负相关.
[归纳总结] 两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系. (二).线性相关
(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条________附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做_________.
^^^
(2)最小二乘法:求线性回归直线方程y=bx+a时,使得样本数据的点到它的________________最小的方法叫做最小二乘法,其中a,b的值由以下公式给出:
n
(xi)(yi)
bi1
n
(xi)2
i1
ab.
xy
i
i1
n
n
i
n,
i1
xin2
2
1
其中=
n
i1
n
1
xi,=
n
y
i1
n
i
,a为回归方程的斜率,b为截距。
预习自测:
1.下列语句所表示的事件中的因素不具有相关关系的是( ) A.瑞雪兆丰年 B.上梁不正下梁歪 C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧 [答案] D
[解析] 选项A,B,C中描述的变量间都具有相关关系,而选项D是迷信说法,没有科学依据.
[规律总结] 函数关系是一种确定性关系,相关关系是一种非确定性关系,判断两个变量间的关系是否为相关关系的关键是看这个关系是否具有不确定性.
2.观察下列散点图,①正相关,②负相关,③不相关,与下列图形相对应的是( )
A.①②③ [答案] D
B.②③① C.②①③ D.①③②
^^^
3.下列有关回归方程y=bx+a的叙述正确的是( )
^
①反映y与x之间的函数关系; ②反映y与x之间的函数关系; ^
③表示y与x之间的不确定关系;
④表示最接近y与x之间真实关系的一条直线. A.①② B.②③ C.③④ D.①④
^^^^
[解析] y=bx+a表示y与x之间的函数关系,而不是y与x之间的函数关系.但它所反映的关系最接近y与x之间的真实关系.故选D.
[规律总结] 回归直线是对原数量关系的一种拟合,如果两个变量不具有线性相关关系,即使求出回归方程也是毫无意义的,而且由其得到估计和预测的值也是不可信的.
^
4.回归直线方程y=bx+a必经过( )
A.(0,0) B.(x,0) C.(0,y) D.(x,y)
(三)、精讲精练
探究一:变量之间的相关关系的判断
例一(1)下列变量之间的关系不是相关关系的是( )
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率
D.每亩田施肥量和粮食亩产量
(2)现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如下:
请利用散点图判断这10名学生的两次数学考试成绩是否具有相关关系. [探究] 1.判断两个变量之间具有相关关系的关键是什么?
2.利用散点图判断两个变量是否具有相关关系的依据是什么?
[解析] (1)在A中,若b确定,则a,b,c都是常数,Δ=b2-4ac也就唯一确这了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.故选A. (2)两次数学考试成绩散点图如图所示,
由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系.因此,这10名学生的两次数学考试成绩具有相关关系. [答案] (1)A
[规律总结] 两个变量x与y相关关系的判断方法:
(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
(2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
[特别提醒] 如果所有的样本点都落在某一函数曲线附近,那么变量之间就有相关关系. 变式一:对变量x,y有观测数据(xi,yi)(i=1,2,„,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,„,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 [答案] C
[解析] 图(1)中的数据y随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据随着u的增大,v也增大,因此u与v正相关. 探究二、回归直线方程 例二:随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用
^^^^^
(1)线性回归方程y=bx+a的回归系数a、b;
(2)估计使用年限为10年时,车的使用总费用是多少? [探究] 第一步,列表xi,yi,xiyi; --n2n2n
第二步,计算x,y,xi,yi,xiyi;
i=1
i=1
i=1
第三步,代入公式计算b,a的值; 第四步,写出回归直线方程. (1)利用公式:
b=
x--x^--a=y-b x,
n^
i=1
ni=1^
i
--
xi-xyi-y
=
2
i=1
--
xiyi-n x yxi2-nx2i=1
n
-
n
来计算回归系数.有时为了方便常列
表,对应列出xiyi、x2i,以利于求和.(2)获得线性回归方程后,取x=10,即得所求. [
于是b=
1.23; 1090-5×4^--
a=y-bx=5-1.23×4=0.08.
^^
(2)线性回归直线方程是y=1.23x+0.08,当x=10(年)时,y=1.23×10+0.08=12.38(万元),即估计使用10年时,支出总费用是12.38万元.
[规律总结] 求回归直线方程的一般步骤:
①收集样本数据,设为(xi,yi),(i=1,2,„,n)(数据一般由题目给出). ②作出散点图,确定x,y具有线性相关关系. ③把数据制成表格xi,yi,x2i,xiyi. ④计算x,y
n
2
,xi,xiyi, i=1i=1
n
xy-nxy
b^
代入公式计算b,a,公式为x-nx
^
a=y-bx.
n
--
^
i=1n
ii
^
i=1
2i
-
2
^-
^^^
⑥写出回归直线方程y=bx+a.
变式二:(1)(2015·石家庄高二检测)已知回归直线的斜率的估计值是1.23,样本点中心(即(x,y))为(4,5),则回归直线的方程是( )
^^^^
A.y=1.23x+4 B.y=1.23x+5 C.y=1.23x+0.08 D.y=0.08x+1.23
(2)某公司的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
^^^^
资料显示y对x呈线性相关关系.根据上表提供的数据得到回归方程y=bx+a中的b=6.5,预测销售额为115万元时约需________万元广告费.
[答案] (1)C (2)15
^^
[解析] (1)由题意知,可设此回归直线的方程为y=1.23x+a,又因为回归直线必过点(x,^^^^
y),所以点(4,5)在直线y=1.23x+a上,所以5=1.23×4+a,a=0.08,
^
故回归直线的方程是y=1.23x+0.08.
2+4+5+6+830+40+60+50+70
(2)x==5,y==50.
55^^^
因为回归方程过样本中心(5,50),代入y=6.5x+a,得a=17.5, ^
所以y=6.5x+17.5,
(四)【课堂小结】
1、求样本数据的线性回归方程,可按下列步骤进行:
(1)计算平均数,; (2)求a,b; (3)写出回归直线方程。
2、回归方程被样本数据惟一确定,对同一个总体,不同的样本数据对应不同的回归直线,所以回归
直线也具有随机性.。
3、对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关 关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的。因此,对一组样本数据, 应先作散点图,在具有线性相关关系的前提下再求回归方程。
〖书面作业〗(14新课标2理)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)⑴求y关于t的线性回归方程;
⑵利用⑴中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别
为:b
ty
i
i
i1
n
ti
i1
n
2
ˆ ˆ,a
【解析】
(1)t
1272.93.33.64.44.85.25.9
4,y4.377
设回归方程为ybta,代入公式,经计算得3*1420.700.51.84.8141b,
(941)*214*221
ay-bt4.3-*42.3
2
所以,y关于t的回归方程为y0.5t2.3.
(2)b
1
0,∴2007年至2013年该区人均纯收入稳步增长,预计到2015年,2
该区人均纯收入y0.592.36.8(千元) 所以,预计到2015年,该区人均纯收入约6千8百元左右。
〖板书设计〗
教学反思:本节课主要是理解与掌握两个变量的相关关系的概念,通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观判断两个变量之间是否具有相关关系;知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。学生基本能够掌握,能明确高考考试方向,但学生在计算方面要进一步加强