变量间的相互关系(一).(二)

2.3变量间的相互关系(一)、(二)

问题提出

1. 函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系.2. 在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?

3. 这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.知识探究(一):变量之间的相关关系

思考1:考察下列问题中两个变量之间的关系,想一想这些问题中两个变量之间的关系是函数关系吗?

(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;

(3)人体内的脂肪含量与年龄.

思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?

你能举出类似的描述生活中两个变量之间的这种关系的成语吗?

思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?

自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.思考4:函数关系与相关关系之间的区别与联系.

函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系.3. 函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化.例1 在下列两个变量的关系中,哪些是相关关系?①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;

④降雪量与交通事故的发生率之间的关系.

练习1.已知下列变量,它们之间的关系是函数关系的有 ① ,是相关关系的有 ②③ .

①已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式△=b2-4ac;

②光照时间和果树亩产量;③每亩施用肥料量和粮食产量.

知识探究(二):散点图

【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:

年龄脂肪年龄脂肪

239.5

5329.6

2717.85430.2

3921.25631.4

4125.95730.8

4527.55833.5

4926.36035.2

5028.26134.6

其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.

思考1:观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?

思考2:以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?

思考3:上图叫做散点图,你能描述一下散点图的含义吗?

在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.

思考4:观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?

思考5:在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?

思考6:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?

一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域思考7:你能列举一些生活中的变量成正相关或负相关的实例吗?例2 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:

房屋面积m2

销售价格(万元)

6112.2

7015.3

11524.8

11021.6

8013510522

18.429.2

画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.

练习2. 今有一组试验数据如下表所示:现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是( C )

x1.993.04.05.16.12

y1.54.047.51218.01

A. y=log2x B. y=2x C. y=(x2-1)/2 D. y=2x-2

问题提出

1. 两个变量之间的相关关系的含义如何?成正相关和负相关的两个相关变量的散点图分别有什么特点?

自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系. 正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域

2. 观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?对此,我们从理论上作些研究.

知识探究(三):回归直线

思考1:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?

()

思考2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点? 这些点大致分布在一条直线附近.

思考3:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?

思考4:在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线?

知识探究(四):回归方程

在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具

有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.

思考1:回归直线与散点图中各点的位置应具有怎样的关系? 整体上最接近

思考2:对于求回归直线方程,你有哪些想法?

思考3:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为ybxa可以用哪些数量关系来刻画各样本点与回归直线的接近程度?

可以用|yiyi|或(yiyi),其中yibxia.

2

思考4:为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?

n

ˆi)2Q(yiy

i1

(y1bx1a)2(y2bx2a)2(ynbxna)2 nn (xi)(yi)xiyi思考5:根据有关数学原理分析,当 bi1ni1n,a (xi)2xi22

ni1i1 2

ˆ)Q(yiy

时,总体偏差 i 1 i 为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.回归方程中,a,b的几何意义分别是什么?

思考6:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程

 0 . 577 x  0 . 48 ,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为多少? 20.9%

练习 3.F表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的



(1)请画出上表数据的散点图;

(2)请根据上表提供的数据,崩最小二乘法求出Y关于x的线性回归方程Y=bx+a; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性

同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解:(1)如图

(2)由对照数据,计算得:

XY66.5 X

ii

i1

i1

44

2

i

3242526286 4.5

ˆ3.50.74.50.35 ˆ66.544.53.566.5630.7 ; aˆb2

8644.58681

所求的回归方程为 y0.7x0.35

(3) x100, y1000.70.3570.35吨,

预测生产100吨甲产品的生产能耗比技改前降低9070.3519.65(吨)

课堂小结

1. 求样本数据的线性回归方程,可按下列步骤进行: 第一步,计算平均数x,y; 第二步,求和

xiyi,xi;

2

i1

i1

n

n

nn

第三步,计算b

(x

i1

n

i

x)(yiy)

i

xy

ii1

n

i

nxynx

2

,aybx;

(x

i1

x)2

x

i1

2i

第四步,写出回归方程 ybxa.

2. 回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.

3. 对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程. 课后作业 《习案》作业:二十三. 、二十四.

2.3变量间的相互关系(一)、(二)

问题提出

1. 函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系.2. 在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?

3. 这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.知识探究(一):变量之间的相关关系

思考1:考察下列问题中两个变量之间的关系,想一想这些问题中两个变量之间的关系是函数关系吗?

(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;

(3)人体内的脂肪含量与年龄.

思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?

你能举出类似的描述生活中两个变量之间的这种关系的成语吗?

思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?

自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.思考4:函数关系与相关关系之间的区别与联系.

函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系.3. 函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化.例1 在下列两个变量的关系中,哪些是相关关系?①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;

④降雪量与交通事故的发生率之间的关系.

练习1.已知下列变量,它们之间的关系是函数关系的有 ① ,是相关关系的有 ②③ .

①已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式△=b2-4ac;

②光照时间和果树亩产量;③每亩施用肥料量和粮食产量.

知识探究(二):散点图

【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:

年龄脂肪年龄脂肪

239.5

5329.6

2717.85430.2

3921.25631.4

4125.95730.8

4527.55833.5

4926.36035.2

5028.26134.6

其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.

思考1:观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?

思考2:以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?

思考3:上图叫做散点图,你能描述一下散点图的含义吗?

在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.

思考4:观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?

思考5:在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?

思考6:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?

一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域思考7:你能列举一些生活中的变量成正相关或负相关的实例吗?例2 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:

房屋面积m2

销售价格(万元)

6112.2

7015.3

11524.8

11021.6

8013510522

18.429.2

画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.

练习2. 今有一组试验数据如下表所示:现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是( C )

x1.993.04.05.16.12

y1.54.047.51218.01

A. y=log2x B. y=2x C. y=(x2-1)/2 D. y=2x-2

问题提出

1. 两个变量之间的相关关系的含义如何?成正相关和负相关的两个相关变量的散点图分别有什么特点?

自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系. 正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域

2. 观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?对此,我们从理论上作些研究.

知识探究(三):回归直线

思考1:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?

()

思考2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点? 这些点大致分布在一条直线附近.

思考3:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?

思考4:在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线?

知识探究(四):回归方程

在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具

有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.

思考1:回归直线与散点图中各点的位置应具有怎样的关系? 整体上最接近

思考2:对于求回归直线方程,你有哪些想法?

思考3:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),…,(xn,yn),设其回归方程为ybxa可以用哪些数量关系来刻画各样本点与回归直线的接近程度?

可以用|yiyi|或(yiyi),其中yibxia.

2

思考4:为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?

n

ˆi)2Q(yiy

i1

(y1bx1a)2(y2bx2a)2(ynbxna)2 nn (xi)(yi)xiyi思考5:根据有关数学原理分析,当 bi1ni1n,a (xi)2xi22

ni1i1 2

ˆ)Q(yiy

时,总体偏差 i 1 i 为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.回归方程中,a,b的几何意义分别是什么?

思考6:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程

 0 . 577 x  0 . 48 ,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为多少? 20.9%

练习 3.F表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的



(1)请画出上表数据的散点图;

(2)请根据上表提供的数据,崩最小二乘法求出Y关于x的线性回归方程Y=bx+a; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性

同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解:(1)如图

(2)由对照数据,计算得:

XY66.5 X

ii

i1

i1

44

2

i

3242526286 4.5

ˆ3.50.74.50.35 ˆ66.544.53.566.5630.7 ; aˆb2

8644.58681

所求的回归方程为 y0.7x0.35

(3) x100, y1000.70.3570.35吨,

预测生产100吨甲产品的生产能耗比技改前降低9070.3519.65(吨)

课堂小结

1. 求样本数据的线性回归方程,可按下列步骤进行: 第一步,计算平均数x,y; 第二步,求和

xiyi,xi;

2

i1

i1

n

n

nn

第三步,计算b

(x

i1

n

i

x)(yiy)

i

xy

ii1

n

i

nxynx

2

,aybx;

(x

i1

x)2

x

i1

2i

第四步,写出回归方程 ybxa.

2. 回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.

3. 对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程. 课后作业 《习案》作业:二十三. 、二十四.


相关内容

  • 员工-组织关系对员工创新行为的影响分析
  • 中国人力资源开发2011年第9期 员工-组织关系对员工创新行为的影响分析 ● 康 力 内容摘要本文以员工-组织关系理论为基础,对不同员工-组织关系模式对员工创新行 为的影响和作用机制进行了实证分析.文章考察了不同的员工-组织关系对员工创新行为的影响,以及组织创新气氛在员工-组织关系对创新行为的影响过 ...

  • 相关分析与回归分析应用辨析
  • 哈尔滨职业技术学院学报 2010年第4期 Journal of Harbin Vocational & Technical College ・123・ 相关分析与回归分析应用辨析 张林泉 (广东女子职业技术学院,广东 广州 511450) 摘要:本文探讨了相关分析与回归分析两者之间的区别与联 ...

  • 中.英利率与证券价格关系的比较
  • 摘要:本文通过对1993年8月-2005年4月中.英利率与证券价格关系的实证研究,探究两变量间短期动态均衡与长期相关关系,比较并分析两国异同点及其原因.结果表明,中.英利率与证券价格在长期中存在均衡关系,但二者相关程度不同,方向相反:两国在不同程度上都存在短.长期利率与证券价格间的因果关系.政策含义 ...

  • 统计学第六章课后题及答案解析
  • 第六章 一.单项选择题 1.下面的函数关系是( ) A 现代化水平与劳动生产率B 圆周的长度决定于它的半径 C 家庭的收入和消费的关系D 亩产量与施肥量 2.相关系数r 的取值范围( ) A -∞ 3.年劳动生产率x(干元) 和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平 ...

  • 生物统计学名词解释
  • 1. 2. 3. 4. 样本: 样本 从总体中抽出的若干个体所构成的集合称为样本. 总体: 总体 指具有相同性质的个体所组成的集合称为总体. 连续变量:表示在不变量范围内可抽出某一范围的所有值. 非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数 值,并且通常是整数. 5. 准确性:指在 ...

  • 数量分析方法模拟试题一
  • 商务统计方法模拟试题一 一.判断题 1. 一般的统计分析人员和SPSS 初学者适合采用程序运行方式. ( ) 2. 在定义数据结构时,每个变量都要定义变量值标签. ( ) 3. 在定义SPSS 变量名时,变量名可以以数字开头. ( ) 4. 利用SPSS 进行数据分析的首要任务是明确数据分析目标. ...

  • 随机变量的数字特征 教案
  • 第四章 随机变量的数字特征 确定一个随机变量的分布往往不是一件容易的事,况且许多问题并不需要考虑随机变量的全面情况,只需知道它的某些特征数值. 例如,在测量某种零件的长度时,测得的长度是一个随机变量,它有自己的分布, 但是人们关心的往往是这些零件的平均长度以及测量结果的精确程度:再如,检查一批棉花的 ...

  • 概率论知识点总结
  • 概率论总结 目 录 一. 前五章总结 第一章 随机事件和概率 ----------1 第二章 随机变量及其分布---------.5 第三章 多维随机变量及其分布-------10 第四章 随机变量的数字特征--------13 第五章 极限定理------------...18 二. 学习概率论这 ...

  • 统计学知识点(完整)
  • 基本统计方法 第一章概论 1. 总体(Population):根据研究目的确定的同质对象的全体(集合):样本(Sample):从总体中随机抽取的部分具有代表性的研究对象. 2. 参数(Parameter):反映总体特征的统计指标,如总体均数.标准差等,用希腊字母表示,是固定的常数:统计量(Stati ...