第二章习题
2.1判断下列抽样方法是否是等概的:
(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.
(3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?
2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值y =9.5(千瓦时),s 2=206. 试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?
解:由已知可得,N=50000,n=300,=9. 5,s 2=206
2ˆ) =v (N ) =N 21-f s 2=50000V (Y
n
1-
300
*206=1706366666 300
v (==41308. 19 该市居民用电量的95%置信区间为
[[N y ±z α(y ) ]=[475000±1.96*41308.19]
2
即为(394035.95,555964.05) 由相对误差公式
u α2v ()
≤10%
可得1. 96*
-n *206≤9. 5*10% n
即n ≥862
欲使相对误差限不超过10%,则样本量至少应为862
2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
n
解析:由已知得:N =10000 n =200 p =0. 35 f ==0. 02
N ∧∧1-f
p (1-p ) =0. 0012 又有:E (p ) =E (p ) =p =0. 35 V (p ) =
n -1
该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:
[E (P ) ±Z αV (P ) ]
2
∧∧
代入数据计算得:该区间为[0.2843,0.4157]
2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:
编号 1 2 3 4 5 6 7 8
文化支出 200 150 170 150 160 130 140 100
编号 11 12 13 14 15 16 17 18
文化支出 150 160 180 130 100 180 100 180
9 10 110 240 19 20 170 120
估计该小区平均的文化支出Y , 并给出置信水平95%的置信区间。 解析:由已知得:N =200 n =20
120
根据表中数据计算得:y =∑y i =144. 5
20i =1
2120
s =y -y =827. 06842 ∑i
20-1i =1
2
()
V (y ) =
∴ 该小区平均文化支出Y
[132.544 ,156.456]
1n
(1-) s 2=37. 21808 (y ) =6. 10015 n N
2
的95%置信区间为:[y ±z α(y ) ]即是:
故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。
2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y =1120(吨),S 2=25600,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。 解析:由题意知:y =1120 f =
n 50
==0. 1429 S 2=25600⇒s =160 N 350
置信水平95%的置信区间为:[y ±z α
2
-f
s ] 代入数据得: n
置信水平95%的置信区间为:[1079.872,1160.872]*350
2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差S 2=68,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多少?
NZ αS 2
2
解析:简单随机抽样所需的样本量n 1=
2
Nd 2+Z αS 2
2
2
n 2=
n 1
70%
由题意知:N =1000 d =2 S =68 代入并计算得:n 1=61. 3036≈61
n 2=
2
Z α=1. 96
2
n 1
=87. 142≈8770%
故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87
2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到y =25,这些企业去年的平均产量为x =22。试估计今年该地区化肥总产量。
=
X 2135==21. 35N 100, =25
∧
解析:由题可知=22,
则,该地区化肥产量均值的比率估计量为
Y =X
y 25
=21. 35=24. 26
24x
=100*24. 26=2426ˆ=N Y R 该地区化肥产量总值Y 的比率估计量为 所以,今年该地区化肥总产量的估计值为2426吨。
2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:
置信水平95%的置信区间,并比较比估计和简单估计的效率。
1n 1
=∑x i =2300+1700+ +1300)=1580
n i =120解析:由题可知
=144. 5
ˆ=r ==144. 5=≈0. 091R
1580
又
R =144. 5=1600*=146. 3291580
1n
S =(y i -) 2=826. 053∑n -1i =1
2
S xy
1n
=∑(y i -)(x i -) =3463. 158n -1i =1
1n 2=(x -) =8831. 579∑i
n -1i =1
S x
2
故平均文化支出的95%的置信区间为
[R -Z α2
-f 2-f 2
ˆS +R ˆ2S 2) , +Z ˆS +R ˆ2S 2) ](S -2R (S -2R yx x R α2yx x
n n
代入数据得(146.329±1.96*1.892)
即为[142.621,150.037]
2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个月后再次测量,结果如下:
的结果进行比较。
1n 1
解:由题可知,=∑x i =95+ +105)=102. 6
n i =110
1n 1
=∑y i =150+ 170)=163
n i =110
1n 12
S =(y -) =*1910=212. 222 ∑i
n -1i =19
2
S xy
1n 1=(y -)(x -) =*1317=146. 333 ∑i i
n -1i =19
S x
2
1n 1=(x i -) 2=*926. 4=106. 933 ∑n -1i =19
故有β0=
S xy S x
2
=
146. 333
=1. 368
106. 933
所以总体均值的回归估计量为
lr =+β0(-) =163+1. 368*(100-102. 6) =159. 443 其方差估计为:
ˆ() =1-f (S 2+β2S 2-2βS ) V lr 0x 0xy
n 101-
=(212. 222+1. 3682*106. 933-2*1. 368*146. 333)
10=1.097 1-f 2
ˆ()=S 而V
n
1-*212. 222 =
10 =19.454
ˆ()
所以,回归估计的结果要优于简单估
第三单元习题答案(仅供参考) 1解:(1)不合适 (2)不合适 (3)合适 (4)不合适
2.将800名同学平均分成8组,在每一组中抽取一名“幸运星”。
=
=20.1
V ()=-
=9.7681-0.2962
=9.4719
=3.0777
(2)置信区间为95%相对误差为10%,则有
按比例分配的总量:n=
=185.4407
185
=n=56,=92,=37
按内曼分配:n=
=175
=33,=99,=43
=
=0.924
根据各层层权及抽样比的结果,可得
()==0.000396981
=1.99%
估计量的标准差为1.99%,比例为9.24% 按比例分配:
n=2663
=479,
=559,
=373,
=240,
=426,
=586
内曼分配:
n=2565
=536,
=520,
=417,
=304,
=396,
=392
5.解:由题意,有
=
=75.79
购买冷冻食品的平均支出为75.79元
又由V ()=+
又n=
V ()
=53.8086
=7.3354
95%的置信区间为[60.63,90.95]。 7.解:(1)对 (2)错 (3)错 (4)错 (5)对
8.解:(1)差错率的估计值=
70%+
30%=0.027
估计的方差v ()==3.1967
标准差为S()=0.0179。
(2)用事后分层的公式计算差错率为==0.03
估计的方差为;v ()=-=2.5726
=0.4,
(2)用分别比估计,有=0.65,所以用分别比估计可计算得=6.4。
用联合比估计,有
=0.5,=0.625,所以用联合比估计可计算得=6.5。
第四章习题
4.1
邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个
解:由题意得到N =400,n =4,M =10,f =
1故==
Mn
n 4==0. 01 N 400
∑
i =1
n
y i =
19+20+16+20
=1. 875(份)
10⨯4
=M ⋅=10⨯1. 875=18. 75(份)
ˆ=M ⋅N ⋅=10⨯400=7500(份) Y
2s b
M =
n -1
∑(i =1
n
i
-) 2
n
1-f 21-f 1v () =s b =
nM nM 2n -1
∑(i =1
i
-) 2
1-0. 01(19-18. 75) 2+ +(20-18. 75) 2=⨯
4-14⨯102
=0. 00391875
ˆ) =N 2M 2v () =4002⨯102⨯0. 00391875=62700 v (Y
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为
0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2 某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽
样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政
(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允
许误差不超过8%,则应抽取多少个单位做样本?
解:题目已知N =87,n =15,f =1)由已知估计同意改革的比例
n 15
=
N 87
ˆ=p
∑y
i =1
n i =1
n
i
=
i
∑M
1=
n
n
646
≈0. 709 911
∑M
i =1
i
=60. 733
11-f 1n
ˆ) =2ˆM i ) 2=0. 008687 v (p (y i -p
n n -1i =1∑
此估计量的标准差为
ˆ) =v (p ˆ) =. 008687=0. 9321 s (p
4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员
欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整
)。
n n
n 10
解:已知N=48, n=10, f==, 由题意得∑y i =736,∑M i =365,
N 48i =1i =1
N n 48ˆ则办公费用的总支出的估计为Y =∑y i =⨯736=3532. 8(元)
n i =1101n 1
群总和均值=∑y i =⨯736=73. 6(元)
n i =110
ˆ) =N (1-f ) ⋅v (Y
n
2
∑(y
i =1
n
i
-) 2
n -1
10)
(83-73. 6) 2+(62-73. 6) 2+... +(80-73. 6) 248= ⨯
109
1
= 182.4⨯⨯3590.4
9
= 72765.44 482⨯(1-
) =269.7507 v (Y
ˆ的置信度为95%的置信区间为3532.8±1.96⨯269.7507,即[3004.089,则Y
4061.511].
4.4 为了便于管理,将某林区划分为386个小区域。现采用简单随机抽样方法,
估计整个林区树的平均高度及95%的置信区间。
解:由已知得N =386,n =20,f =
n 20==0. 0518 N 3866180. 8
=5. 909 1046
整体的平均高度==
∑M
i =1n i -1
n
i
i
=
i
∑M
1M =
n
∑M
i =1
n
i
=52. 3
n
方差估计值v () =v () =
=0. 02706
1-f n 2
∑(y
i =1
i
-M i ) 2
n -1
标准方差s () =v () =0. 02706=0. 1644
在置信度95%下,该林区的树木的平均高度的置信区间为
(±t α/2⋅s () )=(5. 909±1. 96⨯0. 1644) =(5. 5868, 6. 2312)
4.5 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女
生宿舍200间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进
解:题目已知N =200,n =10,M =6,m =3,f 1=
n 10m ==0. 05,f 2==0. 5 N 200M
ˆ=p
∑y
i =1
n
i
nm
=
9
=0. 3 10⨯3
11-f 1ˆ) =2⋅v (p ⋅
n n -1m
∑(y
i =1
n
i
-p ⋅m ) =0. 005747
ˆ) =v (p ) =0. 005747=0. 0758 s (p
在置信度95%下,p 的置信区间为
ˆ±t α/2v (p ˆ) ) =(0. 3±1. 96⨯0. 0758) =(0.151432, 0.448568) (p
4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的
调查,宿舍间的标准差为S 1=326元,宿舍内同学之间的标准差为S 2=188元。以一位同学进行调查来计算,调查每个宿舍的时间c 1为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间为c 0是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生是多少?
解:由已知条件得到以下信息:
S 1=326(元)S 2=188(元)c 1=10(分钟)c 2=1(分钟)c 0=4⨯60=240
(分钟) 由此得到
2S 1
=106276,
S 22
=35344,
S 2u
2
S 235344=S 1-=106276-=100385. 33
M 6
m opt =
S 2c 18810
⋅1=⨯≈1. 82 S 1c 23261
因而取最优的m =2,进一步计算n opt 由于总时间的限制C =480,由关系式
C =c 0+c 1n +c 2nm 得到480=240+10n opt +2n opt
计算方程得到n opt =20,因而取n =20
则最优的样本宿舍数为20间,最优样本学生数为2。
第二章习题
2.1判断下列抽样方法是否是等概的:
(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.
(3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?
2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值y =9.5(千瓦时),s 2=206. 试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?
解:由已知可得,N=50000,n=300,=9. 5,s 2=206
2ˆ) =v (N ) =N 21-f s 2=50000V (Y
n
1-
300
*206=1706366666 300
v (==41308. 19 该市居民用电量的95%置信区间为
[[N y ±z α(y ) ]=[475000±1.96*41308.19]
2
即为(394035.95,555964.05) 由相对误差公式
u α2v ()
≤10%
可得1. 96*
-n *206≤9. 5*10% n
即n ≥862
欲使相对误差限不超过10%,则样本量至少应为862
2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
n
解析:由已知得:N =10000 n =200 p =0. 35 f ==0. 02
N ∧∧1-f
p (1-p ) =0. 0012 又有:E (p ) =E (p ) =p =0. 35 V (p ) =
n -1
该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:
[E (P ) ±Z αV (P ) ]
2
∧∧
代入数据计算得:该区间为[0.2843,0.4157]
2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:
编号 1 2 3 4 5 6 7 8
文化支出 200 150 170 150 160 130 140 100
编号 11 12 13 14 15 16 17 18
文化支出 150 160 180 130 100 180 100 180
9 10 110 240 19 20 170 120
估计该小区平均的文化支出Y , 并给出置信水平95%的置信区间。 解析:由已知得:N =200 n =20
120
根据表中数据计算得:y =∑y i =144. 5
20i =1
2120
s =y -y =827. 06842 ∑i
20-1i =1
2
()
V (y ) =
∴ 该小区平均文化支出Y
[132.544 ,156.456]
1n
(1-) s 2=37. 21808 (y ) =6. 10015 n N
2
的95%置信区间为:[y ±z α(y ) ]即是:
故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。
2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y =1120(吨),S 2=25600,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。 解析:由题意知:y =1120 f =
n 50
==0. 1429 S 2=25600⇒s =160 N 350
置信水平95%的置信区间为:[y ±z α
2
-f
s ] 代入数据得: n
置信水平95%的置信区间为:[1079.872,1160.872]*350
2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差S 2=68,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多少?
NZ αS 2
2
解析:简单随机抽样所需的样本量n 1=
2
Nd 2+Z αS 2
2
2
n 2=
n 1
70%
由题意知:N =1000 d =2 S =68 代入并计算得:n 1=61. 3036≈61
n 2=
2
Z α=1. 96
2
n 1
=87. 142≈8770%
故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87
2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到y =25,这些企业去年的平均产量为x =22。试估计今年该地区化肥总产量。
=
X 2135==21. 35N 100, =25
∧
解析:由题可知=22,
则,该地区化肥产量均值的比率估计量为
Y =X
y 25
=21. 35=24. 26
24x
=100*24. 26=2426ˆ=N Y R 该地区化肥产量总值Y 的比率估计量为 所以,今年该地区化肥总产量的估计值为2426吨。
2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:
置信水平95%的置信区间,并比较比估计和简单估计的效率。
1n 1
=∑x i =2300+1700+ +1300)=1580
n i =120解析:由题可知
=144. 5
ˆ=r ==144. 5=≈0. 091R
1580
又
R =144. 5=1600*=146. 3291580
1n
S =(y i -) 2=826. 053∑n -1i =1
2
S xy
1n
=∑(y i -)(x i -) =3463. 158n -1i =1
1n 2=(x -) =8831. 579∑i
n -1i =1
S x
2
故平均文化支出的95%的置信区间为
[R -Z α2
-f 2-f 2
ˆS +R ˆ2S 2) , +Z ˆS +R ˆ2S 2) ](S -2R (S -2R yx x R α2yx x
n n
代入数据得(146.329±1.96*1.892)
即为[142.621,150.037]
2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个月后再次测量,结果如下:
的结果进行比较。
1n 1
解:由题可知,=∑x i =95+ +105)=102. 6
n i =110
1n 1
=∑y i =150+ 170)=163
n i =110
1n 12
S =(y -) =*1910=212. 222 ∑i
n -1i =19
2
S xy
1n 1=(y -)(x -) =*1317=146. 333 ∑i i
n -1i =19
S x
2
1n 1=(x i -) 2=*926. 4=106. 933 ∑n -1i =19
故有β0=
S xy S x
2
=
146. 333
=1. 368
106. 933
所以总体均值的回归估计量为
lr =+β0(-) =163+1. 368*(100-102. 6) =159. 443 其方差估计为:
ˆ() =1-f (S 2+β2S 2-2βS ) V lr 0x 0xy
n 101-
=(212. 222+1. 3682*106. 933-2*1. 368*146. 333)
10=1.097 1-f 2
ˆ()=S 而V
n
1-*212. 222 =
10 =19.454
ˆ()
所以,回归估计的结果要优于简单估
第三单元习题答案(仅供参考) 1解:(1)不合适 (2)不合适 (3)合适 (4)不合适
2.将800名同学平均分成8组,在每一组中抽取一名“幸运星”。
=
=20.1
V ()=-
=9.7681-0.2962
=9.4719
=3.0777
(2)置信区间为95%相对误差为10%,则有
按比例分配的总量:n=
=185.4407
185
=n=56,=92,=37
按内曼分配:n=
=175
=33,=99,=43
=
=0.924
根据各层层权及抽样比的结果,可得
()==0.000396981
=1.99%
估计量的标准差为1.99%,比例为9.24% 按比例分配:
n=2663
=479,
=559,
=373,
=240,
=426,
=586
内曼分配:
n=2565
=536,
=520,
=417,
=304,
=396,
=392
5.解:由题意,有
=
=75.79
购买冷冻食品的平均支出为75.79元
又由V ()=+
又n=
V ()
=53.8086
=7.3354
95%的置信区间为[60.63,90.95]。 7.解:(1)对 (2)错 (3)错 (4)错 (5)对
8.解:(1)差错率的估计值=
70%+
30%=0.027
估计的方差v ()==3.1967
标准差为S()=0.0179。
(2)用事后分层的公式计算差错率为==0.03
估计的方差为;v ()=-=2.5726
=0.4,
(2)用分别比估计,有=0.65,所以用分别比估计可计算得=6.4。
用联合比估计,有
=0.5,=0.625,所以用联合比估计可计算得=6.5。
第四章习题
4.1
邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个
解:由题意得到N =400,n =4,M =10,f =
1故==
Mn
n 4==0. 01 N 400
∑
i =1
n
y i =
19+20+16+20
=1. 875(份)
10⨯4
=M ⋅=10⨯1. 875=18. 75(份)
ˆ=M ⋅N ⋅=10⨯400=7500(份) Y
2s b
M =
n -1
∑(i =1
n
i
-) 2
n
1-f 21-f 1v () =s b =
nM nM 2n -1
∑(i =1
i
-) 2
1-0. 01(19-18. 75) 2+ +(20-18. 75) 2=⨯
4-14⨯102
=0. 00391875
ˆ) =N 2M 2v () =4002⨯102⨯0. 00391875=62700 v (Y
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为
0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2 某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽
样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政
(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允
许误差不超过8%,则应抽取多少个单位做样本?
解:题目已知N =87,n =15,f =1)由已知估计同意改革的比例
n 15
=
N 87
ˆ=p
∑y
i =1
n i =1
n
i
=
i
∑M
1=
n
n
646
≈0. 709 911
∑M
i =1
i
=60. 733
11-f 1n
ˆ) =2ˆM i ) 2=0. 008687 v (p (y i -p
n n -1i =1∑
此估计量的标准差为
ˆ) =v (p ˆ) =. 008687=0. 9321 s (p
4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员
欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整
)。
n n
n 10
解:已知N=48, n=10, f==, 由题意得∑y i =736,∑M i =365,
N 48i =1i =1
N n 48ˆ则办公费用的总支出的估计为Y =∑y i =⨯736=3532. 8(元)
n i =1101n 1
群总和均值=∑y i =⨯736=73. 6(元)
n i =110
ˆ) =N (1-f ) ⋅v (Y
n
2
∑(y
i =1
n
i
-) 2
n -1
10)
(83-73. 6) 2+(62-73. 6) 2+... +(80-73. 6) 248= ⨯
109
1
= 182.4⨯⨯3590.4
9
= 72765.44 482⨯(1-
) =269.7507 v (Y
ˆ的置信度为95%的置信区间为3532.8±1.96⨯269.7507,即[3004.089,则Y
4061.511].
4.4 为了便于管理,将某林区划分为386个小区域。现采用简单随机抽样方法,
估计整个林区树的平均高度及95%的置信区间。
解:由已知得N =386,n =20,f =
n 20==0. 0518 N 3866180. 8
=5. 909 1046
整体的平均高度==
∑M
i =1n i -1
n
i
i
=
i
∑M
1M =
n
∑M
i =1
n
i
=52. 3
n
方差估计值v () =v () =
=0. 02706
1-f n 2
∑(y
i =1
i
-M i ) 2
n -1
标准方差s () =v () =0. 02706=0. 1644
在置信度95%下,该林区的树木的平均高度的置信区间为
(±t α/2⋅s () )=(5. 909±1. 96⨯0. 1644) =(5. 5868, 6. 2312)
4.5 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女
生宿舍200间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进
解:题目已知N =200,n =10,M =6,m =3,f 1=
n 10m ==0. 05,f 2==0. 5 N 200M
ˆ=p
∑y
i =1
n
i
nm
=
9
=0. 3 10⨯3
11-f 1ˆ) =2⋅v (p ⋅
n n -1m
∑(y
i =1
n
i
-p ⋅m ) =0. 005747
ˆ) =v (p ) =0. 005747=0. 0758 s (p
在置信度95%下,p 的置信区间为
ˆ±t α/2v (p ˆ) ) =(0. 3±1. 96⨯0. 0758) =(0.151432, 0.448568) (p
4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的
调查,宿舍间的标准差为S 1=326元,宿舍内同学之间的标准差为S 2=188元。以一位同学进行调查来计算,调查每个宿舍的时间c 1为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间为c 0是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生是多少?
解:由已知条件得到以下信息:
S 1=326(元)S 2=188(元)c 1=10(分钟)c 2=1(分钟)c 0=4⨯60=240
(分钟) 由此得到
2S 1
=106276,
S 22
=35344,
S 2u
2
S 235344=S 1-=106276-=100385. 33
M 6
m opt =
S 2c 18810
⋅1=⨯≈1. 82 S 1c 23261
因而取最优的m =2,进一步计算n opt 由于总时间的限制C =480,由关系式
C =c 0+c 1n +c 2nm 得到480=240+10n opt +2n opt
计算方程得到n opt =20,因而取n =20
则最优的样本宿舍数为20间,最优样本学生数为2。