选修2-3 随机变量与分布列
一、随机变量
随机变量是概率论的重要概念,把随机试验的结果数量化可使我们对随机试验有更清晰的了解。
随机变量主要有两大类,一类是离散型,其统计规律用概率分布(分布律)来描述;另一类是连续型,其统计规律可用密度函数来描述。高中我们学习二项分布、几何分布和超几何分布三种离散型分布,及正态分布一种连续型分布,其中二项分布和标准正态分布在概率统计中使用频率非常高。
若随机变量ξ只能取有限个数值
取任一可能值
或可列无穷多个数值
则称ξ为离散型随机变量;ξ
的概率记作p (x i ) ,其中i =1, 2,..., n ,
则有概率分布表:
概率分布p (x i ) 的性质:
(1) p (x i ) ≥0,其中i =1,2,..., n ; (2) 二、常用离散型随机变量的概率分布
● “0-1”分布:随机变量ξ的可能取值为0,1.取这些值的概率分别为:p (ξ=m ) =p m q 1-m , m =0,1,其中
∑p (x ) =1
i
i
0
例1.抛掷硬币的试验中,设随机变量ξ表示一次试验中徽花向上的次数,则ξ服从“0-1”分布.
● 几何分布:随机变量ξ的可能取值为1,2,3,...... ,取这些值的概率分别为:p (ξ=m ) =pq m -1, m =1,2,3,... ,其中
0
例2.某种定期奖券中奖率为 p (0
m n -m C M C N -M
● 超几何分布:随机变量ξ的可能取值为0,1,2,3,......, n ,取这些值的概率分别为:p (ξ=m ) =, m =0,1,2,3,..., n ,n
C N
其中n , N
, M 都是正整数,且n ≤N , M ≤N .这种分布称为超几何分布,记为H (n , N , M ) .
例3.一批产品共N 件,其中有M 件次品,进行不放回抽样检查,每次从这批产品中任意取出一件,取出的产品不再放回去,连续取n 次,共取出n 件产品,则取出的n 件产品中的次品数ξ服从超几何分布H (n , N , M ) .
m m n -m
● 二项分布:随机变量ξ的可能取值为0,1,2,3,......, n ,取这些值的概率分别为:p (ξ=m ) =C n p q , m =0,1,2,3,..., n
其中0
例4.一批产品共N 件,其中有 M 件次品,进行放回抽样检查,每次从这批产品中任意取出一件,检查后放回去,连续抽取n 次,则被抽查的n 件产品中的次品数ξ服从二项分布B (n , p ) ,其中p =
M
N
三、正态分布
(1)总体密度曲线:
样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容
1
量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线, 这条曲线叫做总体密度曲线.
它反映了总体在各个范围内取值的概率.根据这条曲
线,可求出总体在区间(a , b ) 内取值的概率等于总体密度曲线,直线x =a , x =b 及x 轴所围图形的面积.
观察总体密度曲线的形状,它具有“两头低,中间高,左右对称”的特征,具有这种特征的总体密度曲线一般可用下面函数的图象来表示或近似表示:
-ϕμ, σ(x ) =(x -μ) 22σ2
, x ∈(-∞, +∞)
式中的实数μ、σ(σ>0) 是参数,分别表示总体的平均数与标准差,ϕμ, σ(x ) 的图象为正态分布密度曲线, 简称正态曲线.
(2)正态曲线有以下特点:
1)曲线在x 轴的上方,与x 轴不相交; 2)曲线关于直线x =μ对称;
3)当x =
μ 4)曲线与x 轴之间的面积为1;
5)当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x 轴平移,当x μ时,曲线下降(减函数),并且当曲线向左、右两边无限延伸时,以x 轴为渐近线无限靠近。 6)当μ一定时,曲线的形状由σ确定:
,总体分布越分散;σ越小,曲线越“瘦高”,总体分布越集中。 σ越大,曲线越“矮胖”
7)当μ=0, σ=1时,正态总体称为标准正态总体,其相应的函数表示式是f (x ) =
x 2
2
12e
-
,其相应的曲线称
为标准正态曲线。标准正态总体N (0,1)在正态总体的研究中占有重要的地位,任何正态分布的概率问题均可转化成标准正态分布的概率问题。
(3)正态分布:一般地,如果对于任何实数a
2
⎰ϕμσ(x ) dx ,则称ξ 的分布
a
,
b
为正态分布.正态分布完全由参数μ和σ确定,因此正态分布常记作N (μ, σ) .如果随机变量ξ 服从正态分布,则记为ξ~N (μ, σ) 。正态分布是概率论和数理统计中最重要的一种分布,一般来讲,若影响某一数量指标的随机因素很多,而每个因素所起的作用不太大,则这个指标近似服从正态分布。如测量的误差;人的身高;农作物的收获量等都近似服从正态分布.
(4)正态总体N (μ, σ) 取值的概率:在区间
2
2
(μ-σ, μ+σ),(μ-2σ, μ+2σ),(μ-3σμ, +3σ)
内取值的概率分别为68.26%、95.44%、99.74%,因此我们时常只在区间(μ-3σ, μ+3σ) 内研究正态总体分布情况,而忽略其他很小的一部分,在实际应用中,通常认为服从于正态分布N 的随机变量只取(μ-3σ, μ+3σ) 之间的(μ, σ)值,并简称之为3σ原则。
2
2
例1.给出下列三个正态总体的函数表达式,请找出其均值μ和标准差σ (1)f (x ) =
121
e
-
x 22
, x ∈(-∞, +∞)
(2)f (x ) =
22e
-
(x -1) 2
8
, x ∈(-∞, +∞)
(3)f (x ) =
-2(x +1) 2
, x ∈(-∞, +∞) 100) 。 例2:在某次数学考试中,考生的成绩ξ服从一个正态分布,即ξ N (90,
(1) 试求考试成绩ξ位于区间(70,100)上的概率是多少?
(2) 若这次考试共有2000名考生,试估计考试成绩在(80,100)之间的考生大约有多少人?
提高练习:
1. 一袋中有5个白球,3个红球,现从袋中往外取球,每次任取一个记下颜色后放回,直到红球出现10次时停止,
设停止时共取了ξ 次球,则P (ξ=12) 等于( )
[***********]93952
A C 12() () B C 11() () C C 11() () D C 11() ()
888888888
2. 某人射击击中目标的概率是0.3,他射击目标时,恰好在第3发子弹首次击中目标的概率为3. 罐中有6个红球,4个白球,从中任取一球,记下颜色后再放回,连续摸取4次,设ξ为取得红球的次数,则ξ的
期望E ξ=
2
4. 设随机变量ξ N (4,σ) , 且P (4
5. 若ξ N (5,1), 求P (6
6. 在一袋中装有1只红球和9只白球,每次从袋中任取一球,取后放回,直到取到红球为止,求取球次数ξ的分布列
7. 某厂生产的圆柱形零件的外径ξ N (4,0.25), 质检人员从该厂生产的1000件零件中随机抽取一件,测得它的外径
为5.7cm ,试问该厂生产的这批零件是否合格?
3
选修2-3 随机变量与分布列
一、随机变量
随机变量是概率论的重要概念,把随机试验的结果数量化可使我们对随机试验有更清晰的了解。
随机变量主要有两大类,一类是离散型,其统计规律用概率分布(分布律)来描述;另一类是连续型,其统计规律可用密度函数来描述。高中我们学习二项分布、几何分布和超几何分布三种离散型分布,及正态分布一种连续型分布,其中二项分布和标准正态分布在概率统计中使用频率非常高。
若随机变量ξ只能取有限个数值
取任一可能值
或可列无穷多个数值
则称ξ为离散型随机变量;ξ
的概率记作p (x i ) ,其中i =1, 2,..., n ,
则有概率分布表:
概率分布p (x i ) 的性质:
(1) p (x i ) ≥0,其中i =1,2,..., n ; (2) 二、常用离散型随机变量的概率分布
● “0-1”分布:随机变量ξ的可能取值为0,1.取这些值的概率分别为:p (ξ=m ) =p m q 1-m , m =0,1,其中
∑p (x ) =1
i
i
0
例1.抛掷硬币的试验中,设随机变量ξ表示一次试验中徽花向上的次数,则ξ服从“0-1”分布.
● 几何分布:随机变量ξ的可能取值为1,2,3,...... ,取这些值的概率分别为:p (ξ=m ) =pq m -1, m =1,2,3,... ,其中
0
例2.某种定期奖券中奖率为 p (0
m n -m C M C N -M
● 超几何分布:随机变量ξ的可能取值为0,1,2,3,......, n ,取这些值的概率分别为:p (ξ=m ) =, m =0,1,2,3,..., n ,n
C N
其中n , N
, M 都是正整数,且n ≤N , M ≤N .这种分布称为超几何分布,记为H (n , N , M ) .
例3.一批产品共N 件,其中有M 件次品,进行不放回抽样检查,每次从这批产品中任意取出一件,取出的产品不再放回去,连续取n 次,共取出n 件产品,则取出的n 件产品中的次品数ξ服从超几何分布H (n , N , M ) .
m m n -m
● 二项分布:随机变量ξ的可能取值为0,1,2,3,......, n ,取这些值的概率分别为:p (ξ=m ) =C n p q , m =0,1,2,3,..., n
其中0
例4.一批产品共N 件,其中有 M 件次品,进行放回抽样检查,每次从这批产品中任意取出一件,检查后放回去,连续抽取n 次,则被抽查的n 件产品中的次品数ξ服从二项分布B (n , p ) ,其中p =
M
N
三、正态分布
(1)总体密度曲线:
样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容
1
量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线, 这条曲线叫做总体密度曲线.
它反映了总体在各个范围内取值的概率.根据这条曲
线,可求出总体在区间(a , b ) 内取值的概率等于总体密度曲线,直线x =a , x =b 及x 轴所围图形的面积.
观察总体密度曲线的形状,它具有“两头低,中间高,左右对称”的特征,具有这种特征的总体密度曲线一般可用下面函数的图象来表示或近似表示:
-ϕμ, σ(x ) =(x -μ) 22σ2
, x ∈(-∞, +∞)
式中的实数μ、σ(σ>0) 是参数,分别表示总体的平均数与标准差,ϕμ, σ(x ) 的图象为正态分布密度曲线, 简称正态曲线.
(2)正态曲线有以下特点:
1)曲线在x 轴的上方,与x 轴不相交; 2)曲线关于直线x =μ对称;
3)当x =
μ 4)曲线与x 轴之间的面积为1;
5)当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x 轴平移,当x μ时,曲线下降(减函数),并且当曲线向左、右两边无限延伸时,以x 轴为渐近线无限靠近。 6)当μ一定时,曲线的形状由σ确定:
,总体分布越分散;σ越小,曲线越“瘦高”,总体分布越集中。 σ越大,曲线越“矮胖”
7)当μ=0, σ=1时,正态总体称为标准正态总体,其相应的函数表示式是f (x ) =
x 2
2
12e
-
,其相应的曲线称
为标准正态曲线。标准正态总体N (0,1)在正态总体的研究中占有重要的地位,任何正态分布的概率问题均可转化成标准正态分布的概率问题。
(3)正态分布:一般地,如果对于任何实数a
2
⎰ϕμσ(x ) dx ,则称ξ 的分布
a
,
b
为正态分布.正态分布完全由参数μ和σ确定,因此正态分布常记作N (μ, σ) .如果随机变量ξ 服从正态分布,则记为ξ~N (μ, σ) 。正态分布是概率论和数理统计中最重要的一种分布,一般来讲,若影响某一数量指标的随机因素很多,而每个因素所起的作用不太大,则这个指标近似服从正态分布。如测量的误差;人的身高;农作物的收获量等都近似服从正态分布.
(4)正态总体N (μ, σ) 取值的概率:在区间
2
2
(μ-σ, μ+σ),(μ-2σ, μ+2σ),(μ-3σμ, +3σ)
内取值的概率分别为68.26%、95.44%、99.74%,因此我们时常只在区间(μ-3σ, μ+3σ) 内研究正态总体分布情况,而忽略其他很小的一部分,在实际应用中,通常认为服从于正态分布N 的随机变量只取(μ-3σ, μ+3σ) 之间的(μ, σ)值,并简称之为3σ原则。
2
2
例1.给出下列三个正态总体的函数表达式,请找出其均值μ和标准差σ (1)f (x ) =
121
e
-
x 22
, x ∈(-∞, +∞)
(2)f (x ) =
22e
-
(x -1) 2
8
, x ∈(-∞, +∞)
(3)f (x ) =
-2(x +1) 2
, x ∈(-∞, +∞) 100) 。 例2:在某次数学考试中,考生的成绩ξ服从一个正态分布,即ξ N (90,
(1) 试求考试成绩ξ位于区间(70,100)上的概率是多少?
(2) 若这次考试共有2000名考生,试估计考试成绩在(80,100)之间的考生大约有多少人?
提高练习:
1. 一袋中有5个白球,3个红球,现从袋中往外取球,每次任取一个记下颜色后放回,直到红球出现10次时停止,
设停止时共取了ξ 次球,则P (ξ=12) 等于( )
[***********]93952
A C 12() () B C 11() () C C 11() () D C 11() ()
888888888
2. 某人射击击中目标的概率是0.3,他射击目标时,恰好在第3发子弹首次击中目标的概率为3. 罐中有6个红球,4个白球,从中任取一球,记下颜色后再放回,连续摸取4次,设ξ为取得红球的次数,则ξ的
期望E ξ=
2
4. 设随机变量ξ N (4,σ) , 且P (4
5. 若ξ N (5,1), 求P (6
6. 在一袋中装有1只红球和9只白球,每次从袋中任取一球,取后放回,直到取到红球为止,求取球次数ξ的分布列
7. 某厂生产的圆柱形零件的外径ξ N (4,0.25), 质检人员从该厂生产的1000件零件中随机抽取一件,测得它的外径
为5.7cm ,试问该厂生产的这批零件是否合格?
3