统计与概率知识点汇总

高中统计与概率知识点汇总

(一)统计

一、简单随机抽样

1.总体和样本

在统计学中 , 把研究对象的全体叫做总体.

把每个研究对象叫做个体.

把总体中个体的总数叫做总体容量.

为了研究总体的有关性质,一般从总体中随机抽取一部分:, , , 研究,我们称它为样本.其中个体的个数称为样本容量.

2.简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随 机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

3.简单随机抽样常用的方法:

(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

4.抽签法:

(1)给调查对象群体中的每一个对象编号;

(2)准备抽签的工具,实施抽签

(3)对样本中的每一个个体进行测量或调查

例:请调查你所在的学校的学生做喜欢的体育活动情况。

5.随机数表法:

例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

二、系统抽样

1.系统抽样(等距抽样或机械抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体规模)/n(样本规模)

前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布成某种循环性规律,且这种循环和抽样距离重合。

系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。

三、分层抽样

1.分层抽样(类型抽样):

先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

两种方法:

(1)先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。

(2)先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。

2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。

分层标准:

(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。

(3)以那些有明显分层区分的变量作为分层变量。

3.分层的比例问题:

(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资

料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。

四、用样本的频率分布估计总体分布

1.频率分布直方图

①组距与分组:样本容量越大,分组越多,当样本容量不超过100时,一般可分成5~12组,组距力求“取整”。

②直方图中小长方形的面积表示相应各组的频率,小长方形的面积之和为1。

③频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

2.茎叶图:茎是指中间的一列数,叶就是从茎的旁边生长出来的数,中间的数字表示得数的十位数,旁边的数字分别表示两个人得分的个位数.一般将各个数据的叶按大小次序写在茎的左右侧。

五、用样本的数字特征估计总体的数字特征

1.平均数:xx1x2xn

n

2.极差:一组数据中的最大值减去最小值的差,它反映了这组数据的偏离程度.

3.方差:(x1x)2(x2x)2(xnx)2

4.标准差:ss n,标准差越小越稳定.2

5.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

6.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变

(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍

(3)一组数据中的最大值和最小值对标准差的影响,区间(x3s,x3s)的应用; “去掉一个最高分,去掉一个最低分”中的科学道理

7.如何从频率分布直方图估计样本的数字特征:

① 中位数:在直方图中,中位数左边和右边的直方图的面积应该相等。

② 平均数:在直方图中,平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。

六、两个变量的线性相关

1、概念:

(1)回归直线方程:散点图中的点从整体上看分布在一条直线附近,这条直线叫回归直线.

(2)回归系数:直线方程y=kx+b,我们把直线方程记作:y=bx+a,其中,a,b叫做回归系数.b是直线的斜率,a是截距.

2.最小二乘法

3.直线回归方程的应用

(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存

的数量关系

(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即

因变量Y)进行估计,即可得到个体Y值的容许区间。

(3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控

制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。

(二)概 率

随机事件的概率及概率的意义

1、基本概念:

(1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件;

(2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事件;

(3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件;

(4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件;

(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次

nA

试验中事件A出现的次数nA为事件A出现的频数;称事件A出现的比例fn(A)=n为 事件A出现的概率:对于给定的随机事件A,如果随着试验次数的增加,事件A发生的 频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率。

(6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数

nA

n的比值n,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多, 这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机 事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率。

3.1.3 概率的基本性质

1、基本概念:

(1)事件的包含、并事件、交事件、相等事件

(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥;

(3)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件;

(4)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);若事件A与B为对立事件,

则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)

2、概率的基本性质:

1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1;

2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);

3)若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B);

4)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A发生且事件B不发生;(2)事件A

不发生且事件B发生;(3)事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;(1)事件A发生B不发生;(2)事件B发生事件A不发生,对立事件互斥事件的特殊情形。

3.2.1 —3.2.2古典概型及随机数的产生

1、(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性。

(2)古典概型的解题步骤;

①求出总的基本事件数;

A包含的基本事件数

②求出事件A所包含的基本事件数,然后利用公式P(A)=总的基本事件个数

3.3.1—3.3.2几何概型及均匀随机数的产生

1、基本概念:

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;

(2)几何概型的概率公式:

构成事件A的区域长度(面积或体积)

的区域长度(面积或体积)P(A)=试验的全部结果所构成;

(1) 几何概型的特点:

1)试验中所有可能出现的结果(基本事件)有无限多个;

2)每个基本事件出现的可能性相等.

高中统计与概率知识点汇总

(一)统计

一、简单随机抽样

1.总体和样本

在统计学中 , 把研究对象的全体叫做总体.

把每个研究对象叫做个体.

把总体中个体的总数叫做总体容量.

为了研究总体的有关性质,一般从总体中随机抽取一部分:, , , 研究,我们称它为样本.其中个体的个数称为样本容量.

2.简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随 机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

3.简单随机抽样常用的方法:

(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

4.抽签法:

(1)给调查对象群体中的每一个对象编号;

(2)准备抽签的工具,实施抽签

(3)对样本中的每一个个体进行测量或调查

例:请调查你所在的学校的学生做喜欢的体育活动情况。

5.随机数表法:

例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

二、系统抽样

1.系统抽样(等距抽样或机械抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体规模)/n(样本规模)

前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布成某种循环性规律,且这种循环和抽样距离重合。

系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。

三、分层抽样

1.分层抽样(类型抽样):

先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

两种方法:

(1)先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。

(2)先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。

2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。

分层标准:

(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。

(3)以那些有明显分层区分的变量作为分层变量。

3.分层的比例问题:

(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资

料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。

四、用样本的频率分布估计总体分布

1.频率分布直方图

①组距与分组:样本容量越大,分组越多,当样本容量不超过100时,一般可分成5~12组,组距力求“取整”。

②直方图中小长方形的面积表示相应各组的频率,小长方形的面积之和为1。

③频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

2.茎叶图:茎是指中间的一列数,叶就是从茎的旁边生长出来的数,中间的数字表示得数的十位数,旁边的数字分别表示两个人得分的个位数.一般将各个数据的叶按大小次序写在茎的左右侧。

五、用样本的数字特征估计总体的数字特征

1.平均数:xx1x2xn

n

2.极差:一组数据中的最大值减去最小值的差,它反映了这组数据的偏离程度.

3.方差:(x1x)2(x2x)2(xnx)2

4.标准差:ss n,标准差越小越稳定.2

5.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

6.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变

(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍

(3)一组数据中的最大值和最小值对标准差的影响,区间(x3s,x3s)的应用; “去掉一个最高分,去掉一个最低分”中的科学道理

7.如何从频率分布直方图估计样本的数字特征:

① 中位数:在直方图中,中位数左边和右边的直方图的面积应该相等。

② 平均数:在直方图中,平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和。

六、两个变量的线性相关

1、概念:

(1)回归直线方程:散点图中的点从整体上看分布在一条直线附近,这条直线叫回归直线.

(2)回归系数:直线方程y=kx+b,我们把直线方程记作:y=bx+a,其中,a,b叫做回归系数.b是直线的斜率,a是截距.

2.最小二乘法

3.直线回归方程的应用

(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存

的数量关系

(2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即

因变量Y)进行估计,即可得到个体Y值的容许区间。

(3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控

制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。

(二)概 率

随机事件的概率及概率的意义

1、基本概念:

(1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件;

(2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事件;

(3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件;

(4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件;

(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次

nA

试验中事件A出现的次数nA为事件A出现的频数;称事件A出现的比例fn(A)=n为 事件A出现的概率:对于给定的随机事件A,如果随着试验次数的增加,事件A发生的 频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率。

(6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数

nA

n的比值n,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多, 这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机 事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率。

3.1.3 概率的基本性质

1、基本概念:

(1)事件的包含、并事件、交事件、相等事件

(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥;

(3)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件;

(4)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);若事件A与B为对立事件,

则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)

2、概率的基本性质:

1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1;

2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);

3)若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B);

4)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A发生且事件B不发生;(2)事件A

不发生且事件B发生;(3)事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;(1)事件A发生B不发生;(2)事件B发生事件A不发生,对立事件互斥事件的特殊情形。

3.2.1 —3.2.2古典概型及随机数的产生

1、(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性。

(2)古典概型的解题步骤;

①求出总的基本事件数;

A包含的基本事件数

②求出事件A所包含的基本事件数,然后利用公式P(A)=总的基本事件个数

3.3.1—3.3.2几何概型及均匀随机数的产生

1、基本概念:

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型;

(2)几何概型的概率公式:

构成事件A的区域长度(面积或体积)

的区域长度(面积或体积)P(A)=试验的全部结果所构成;

(1) 几何概型的特点:

1)试验中所有可能出现的结果(基本事件)有无限多个;

2)每个基本事件出现的可能性相等.


相关内容

  • 初中数学_概率与统计题知识点汇总_中考
  • 中考数学统计与概率试题汇编 一.选择题 1.(福建福州4分)从1,2,﹣3三个数中,随机抽取两个数相乘,积是正数的概率是 A.0 B. C. 3 3 D.1 2.(福建泉州3分)下列事件为必然事件的是 A.打开电视机,它正在播广告 B.抛掷一枚硬币,一定正面朝上 C.投掷一枚普通的正方体骰子,掷得的 ...

  • 2014统计学试题库
  • < 统 计 学 > 试 题 库 知识点一: 统计基本理论和基本概念 一.填空题 1.统计研究的具体方法主要有. . 2.统计工作可划分为. 四个阶段. 3.随着是可以相互转化的. 4.标志是说明. 5.可变的数量标志和所有的统计指标称为,变量的具体数值称为 6.变量按分,可分为连续变量和 ...

  • [可能性大小]的教学反思
  • 一.背景分析 "可能性的大小" 这一教学内容是新课程标准增加的概率知识内容,是课程改革后首次在小学数学课程中(人教版三年级上册p106-107例3.例4.例5:北师大三年级上册第84.85页)出现的,从而相关的教学可以说是一个全新的尝试.以往在教学这一内容时教学思路大同小异,基本 ...

  • 贾俊平统计学总结
  • 第一章 导论 概念: 统计学:收集.处理.分析.解释数据井从数据中得出结论的科学. 统计的分类: 描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法. 推断统计:是研究如何利用样木数据进行推断总体特征. 数据: 1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述 ...

  • 统计与概率教学设计(3)
  • 课题 统计 课型 复习 1.通过复习已学过的统计的初步知识,加深学生对统计的意义及其应用的 理解. 教学目标 2.培养学生会看.会分析.会制作简单统计图表的能力和综合运用统计知 (三维目标) 识解决实际问题的能力. 3.培养统计意识,提高学习兴趣. 教学重点 教学难点 课前准备 综合分析能力 对比观 ...

  • 统计学试题库
  • < 统 计 学 > 试 题 库 知识点一: 统计基本理论和基本概念 一.填空题 1.统计是 料 是统计工作的成果, 统计学 是统计工作的经验总结和理论概括. 2.统计研究的具体方法主要有. 统计分组法 综合指标法 . 和 归纳推断法 . 3.统计工作可划分为 .和 4.随着 5.标志是说 ...

  • 多项分类Logistic回归分析的功能与意义 (1)
  • 多项分类Logistic 回归分析的功能与意义 我们经常会遇到因变量有多个取值而且无大小顺序的情况,比如职业.婚姻情况等等,这时一般的线性回归分析无法准确地刻画变量之间的因果关系,需要用其它回归分析方法来进行拟合模型.SPSS 的多项分类Logistic 回归便是一种简便的处理该类因变量问题的分析方 ...

  • 基础统计学笔记
  • 一.统计学概论: 分理论统计和应用统计: 应用统计分为描述统计学和推断统计学. 描述统计为一组数据的中(位置:均值.中位数).散(极差.方差.标准差).形|(偏度)描述. 推断统计分为参数估计和假设检验. 技能: 1.经验--数据收集加工--画成图形--数理(规律) (数据不等于数字) PPT 原则 ...

  • 调查问卷的SPSS统计图分析
  • 调查问卷的SPSS 统计图分析 在作频数分析.描述分析时可以直接做出图形,简单方便,同时也可以另外作图.统计图是用点的位置.线段的升降.直条的长短或面积的大小等来表达资料的内容.它可以把资料所反映的变化趋势.数量多少.分布状态和相互关系等形象.直观地表现出来,以便于读者阅读.比较和分析.由于计算机绘 ...