创新设计全国通用2017届高考数学二轮复习专题六概率与统计第2讲统计与统计案例课件文_图文


第2讲

统计与统计案例

高考定位

1. 以选择题、填空题考查的内容有样本数字特征

的计算、频率分布直方图、条形图、茎叶图、线性回归方程、
独立性检验等; 2. 以解答题考查线性回归直线方程、独立性 检验以及概率与统计的交汇,都属于中、低档题,也是必得 分的题目.

真题感悟 (2016· 全国Ⅰ卷)某公司计划购买1台机器,该种机器使用三 年后即被淘汰 .机器有一易损零件,在购进机器时,可以额

外购买这种零件作为备件,每个200元.在机器使用期间,如
果备件不足再购买,则每个500元.现需决策在购买机器时应 同时购买几个易损零件,为此搜集并整理了100台这种机器 在三年使用期内更换的易损零件数,得下面柱状图.

记 x表示1台机器在三年使用期内需更换的易损零件数,y 表 示1台机器在购买易损零件上所需的费用 (单位:元),n表示 购机的同时购买的易损零件数. (1)若n=19,求y与x的函数解析式; (2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,

求n的最小值;

(3)假设这100台机器在购机的同时每台都购买19个易损零件,

或每台都购买20个易损零件,分别计算这100台机器在购买易
损零件上所需费用的平均数,以此作为决策依据,购买1台机 器的同时应购买19个还是20个易损零件?
解 (1)当 x≤19 时,y=3 800;当 x>19 时,y=3 800+

500(x-19)=500x-5 700.所以 y 与 x 的函数解析式为
? ?3 800,x≤19, y=? (x∈N). ? ?500x-5 700,x>19

(2)由柱状图知,需更换的零件数不大于18的频率为0.46, 不大于19的频率为0.7,故n的最小值为19.

(3)若每台机器在购机同时都购买 19 个易损零件,则这 100 台机器 中有 70 台在购买易损零件上的费用为 3 800, 20 台的费用为 4 300, 10 台的费用为 4 800, 因此这 100 台机器在购买易损零件上所需费 1 用的平均数为100(3 800×70+4 300×20+4 800×10)=4 000,

若每台机器在购机同时都购买 20 个易损零件,则这 100 台机器中 有 90 台在购买易损零件上的费用为 4 000,10 台的费用为 4 500, 因此这 100 台机器在购买易损零件上所需费用的平均数为 1 100(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买 1 台机器的同时应购买 19 个易损零件.

考点整合
N 1.系统抽样:如果遇到 n 不是整数的情况,可以先从总体中随机 剔除几个个体,使得总体中剩余的个体能被样本容量整除. 2.在频率分布直方图中,小长方形的面积=频率,各小长方形的 面积的总和等于 1.

3.方差与标准差 1 s =n[(x1- x )2+(x2- x )2+?+(xn- x )2],
2

s=

1 2 2 2 [ ( x 1- x ) +(x2- x ) +?+(xn- x ) ]. n

^x+a ^经过样本点的中心点( x , y ),若 x 取某 4.回归直线^ y=b ^x+a ^中,可求出 y 的估计值. 一个值代入回归直线方程^ y=b

5.独立性检验

对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频
数列联表是:
y1 x1 x2 总计 a c a +c y2 b d b+d 总计 a+b c+d n

2 n ( ad - bc ) 则 K2= (其中 n= (a+b)(c+d)(a+c)(b+d)

a+b+c+d 为样本容量).

热点一 统



[微题型1] 抽样方法 【例 1 - 1 】 (2015· 湖南卷 ) 在一次马拉松比赛中, 35 名运动员的成绩(单位:分钟)的茎叶图如图所示

若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中 抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )

A.3
解析

B.4

C.5

D.6

由题意知,将1~35号分成7组,每组5名运动员,成绩

落在区间[139,151]的运动员共有4组,故由系统抽样法知,
共抽取4名.选B. 答案 B

探究提高

(1)随机抽样各种方法中,每个个体被抽到的概率都

是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码
间隔相同;(3)分层抽样满足:各层抽取的比例都等于样本容量 在总体容量中的比例.

[微题型2] 频率分布直方图 【例1-2】 (2016· 北京卷)某市民用水拟实行阶梯水价,每人月
用水量中不超过 w立方米的部分按 4元/立方米收费,超出w立 方米的部分按 10元/立方米收费,从该市随机调查了 10 000位 居民,获得了他们某月的用水量数据,整理得到如下频率分 布直方图:

(1) 如果 w 为整数,那么根据此次调查,为使 80% 以上居民在

该月的用水价格为4元/立方米,w至少定为多少?
(2) 假设同组中的每个数据用该组区间的右端点值代替,当 w =3时,估计该市居民该月的人均水费. 解 (1)如题图所示,用水量在[0.5,3)的频率的和为: (0.2+0.3+0.4+0.5+0.3)×0.5=0.85.

∴用水量小于等于3立方米的频率为0.85,又w为整数,
∴为使80%以上的居民在该月的用水价格为 4元/立方米,w至少 定为3.

(2)当w=3时,该市居民该月的人均水费估计为:

(0.1×1 + 0.15×1.5 + 0.2×2 + 0.25×2.5 + 0.15×3)×4 +
0.15×3×4+ [0.05×(3.5- 3) + 0.05×(4- 3) +0.05×(4.5 -3)]×10=7.2+1.8+1.5=10.5(元). 即该市居民该月的人均水费估计为10.5元.

探究提高 利用频率分布直方图估计样本的数字特征 (1) 中位数:在频率分布直方图中,中位数左边和右边的直方 图的面积相等,由此可以估计中位数的值.

(2) 平均数:平均数为频率分布直方图的 “重心”,等于图中
每个小矩形的面积乘以小矩形底边中点的横坐标之和. (3) 众数:在频率分布直方图中,众数是最高的矩形底边的中 点的横坐标.

[微题型3] 茎叶图与数字特征 【例 1 - 3 】 (2015· 山东卷 ) 为比较甲、乙两地某月 14 时的 气温状况,随机选取该月中的5天,将这5天中14时的气

温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:

①甲地该月14时的平均气温低于乙地该月 14时的平均气温;

②甲地该月14时的平均气温高于乙地该月 14时的平均气温;

③甲地该月14时的气温的标准差小于乙地该月 14时的气温的
标准差; ④甲地该月14时的气温的标准差大于乙地该月 14时的气温的 标准差. 其中根据茎叶图能得到的统计结论的编号为( A.①③ C.②③ B.①④ D.②④ )

解析

甲地 5 天的气温为:26,28,29,31,31,

26+28+29+31+31 其平均数为 x 甲= =29; 5 1 方差为 s甲=5[(26-29)2+(28-29)2+(29-29)2+(31-29)2
2

+(31-29)2]=3.6; 标准差为 s 甲= 3.6.

乙地 5 天的气温为:28,29,30,31,32, 28+29+30+31+32 其平均数为 x 乙= =30; 5

1 方差为 s乙=5[(28-30)2+(29-30)2+(30-30)2+(31
2

-30)2+(32-30)2]=2; 标准差为 s 乙= 2.∴ x 甲< x 乙,s 甲>s 乙.

答案 B

探究提高

(1)平均数的大小与一组数据里每个数据均有关系,任

何一个数据的变动都会引起平均数的变动,而中位数和众数都不 具备此性质. (2)众数考查各数据出现的频率,当一组数据中有不少数据多次出 现时,众数往往更能反映问题. (3)中位数仅与数据的排列位置有关,中位数可能出现在所给数据

中,也可能不在所给数据中,当一组数据中的个别数据变动较大
时,可用中位数描述其集中趋势.

【训练1】 (2016· 合肥5月模拟) 为了比较两种治疗失眠症的药 (分 别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位 患者服用 B 药,这 40 位患者在服用一段时间后,记录他们日平 均增加的睡眠时间(单位:h).试验的观测结果如下:

服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.5 2.6 2.7 1.2 1.5 2.7 2.8 1.5 1.8 2.9 2.2 3.0 2.3 3.1 3.2 2.3 3.5 2.4

服用B药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4

1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5

(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效

更好?
(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效 更好?

解 (1)设 A 药观测数据的平均数为 x,B 药观测数据的平均数 1 为 y ,由观测结果可得 x =20(0.6+1.2+1.2+1.5+1.5+1.8+2.2 +2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2 +3.5)=2.3, 1 y = 20 (0.5 + 0.5 + 0.6 + 0.8 + 0.9 + 1.1 + 1.2 + 1.2 + 1.3 + 1.4 +
1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得 x > y ,因此可看出 A 药的疗效更好.

(2)由观测结果可绘制如下茎叶图:

7 从以上茎叶图可以看出, A 药疗效的试验结果有10的叶集中在茎 7 2.,3.上,而 B 药疗效的试验结果有 的叶集中在茎 0.,1.上, 10 由此可看出 A 药的疗效更好.

热点二 统计案例
[微题型1] 对回归直线方程的考查 【例 2 - 1 】 (2015· 全国 Ⅰ 卷 ) 某公司为确定下一年度投入 某种产品的宣传费,需了解年宣传费x(单位:千元)对年 销售量y(单位:t)和年利润z(单位:千元)的影响,对近8 年的年宣传费 xi 和年销售量 yi(i= 1, 2 ,?,8) 数据作了

初步处理,得到下面的散点图及一些统计量的值.

x

y

w

8 8 2 2 ( x ? x ) ( w ? w ) ? i ? i i?1 i?1

8 8 ? ( xi ? x) · ? (wi ? w) · i?1 i?1

( yi ? y)
1 469

( yi ? y)
108.8

46.6 563 6.8

289.8

1.6

18 表中 wi = xi, w= ?wi. 8i=1 (1)根据散点图判断, y=a+bx 与 y=c+d x哪一个适宜作为年 销售量 y 关于年宣传费 x 的回归方程类型?(给出判断即可, 不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;

(3)已知这种产品的年利润 z与x,y的关系为z=0.2y-x.根据(2)的
结果回答下列问题: ①年宣传费x=49时,年销售量及年利润的预报值是多少? ②年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),?,(un,vn),其回归 直线v=α+βu的斜率和截距的最小二乘估计分别为:

解 (1)由散点图可以判断, y=c+d x适宜作为年销售量 y 关于年宣传费 x 的回归方程类型. (2)令 w= x,先建立 y 关于 w 的线性回归方程,由于

^ ^ w =563-68×6.8=100.6, c= y -d 所以 y 关于 w 的线性回归方程为^ y=100.6+68w,因此 y 关于 x 的回归方程为^ y=100.6+68 x.

(3)①由(2)知,当 x=49 时,年销售量 y 的预报值 ^ y=100.6+68 49=576.6, 年利润 z 的预报值^ z =576.6×0.2-49=66.32. ②根据(2)的结果知,年利润 z 的预报值 ^ z =0.2(100.6+68 x)-x=-x+13.6 x+20.12.

13.6 所以当 x= =6.8, 2 即 x=46.24 时,^ z 取得最大值. 故年宣传费为 46.24 千元时,年利润的预报值最大.

探究提高

若x,y为线性相关,可直接求其线性回归方程;

若x,y为非线性相关,可通过换元先建立线性回归方程,然 后再转化为非线性回归方程.

[微题型2] 对独立性检验的考查 【例 2-2】 某新闻媒体为了了解观众对央视《开门大吉》 节目的喜爱与性别是否有关系,随机调查了观看该节目 的观众110名,得到如下的列联表:
女 喜爱 不喜爱 总计 40 20 60 男 20 30 50 总计 60 50 110

试根据样本估计总体的思想,估计约有 ________ 的把握认 为“喜爱该节目与否和性别有关”. 参考附表:
P(K2≥k0) k0 0.050 3.841 0.010 0.001

6.635 10.828

2 n ( ad - bc ) (参考公式:K2= ,其中 (a+b)(c+d)(a+c)(b+d)

n=a+b+c+d)

解析 假设喜爱该节目和性别无关,分析列联表中数据,可得 K2 110×(40×30-20×20)2 的一个观测值 k= ≈7.822>6.635,所 60×50×60×50 以有 99%的把握认为“喜爱 《开门大吉》 节目与否和性别有关” .

答案 99%

探究提高 独立性检验的具体步骤是:第一步,根据题意确定临 界值并作无关假设;第二步,找相关数据,列出 2×2 列联表;
2 n ( ad - bc ) 第三步, 由公式 K2= (其中 n (a+b)(c+d)(a+c)(b+d)

=a+b+c+d)计算出 K2 的观测值;第四步,将 K2 的观测值与临 界值进行比较,进而作出推断.

【训练2】 (1)某单位为了解用电量y(度)与气温x(℃)之间的关系,

随机统计了某4天的用电量与当天气温,并制作了对照表:
气温 x(℃) 用电量 y(度) 18 24 13 34 10 38 -1 64

^x+a ^中b ^=-2, 由表中数据得线性回归方程^ y=b 预测当气温 为-4 ℃时,用电量的度数约为( A.65 B.66 C.67 ) D.68

(2)春节期间,“厉行节约,反对浪费”之风悄然吹开,某市

通过随机询问100名性别不同的居民是否能做到“光盘”行动,
得到如下的列联表:
做不到“光盘” 能做到“光盘” 男 女 45 30 10 15

附:
P(K2≥k0) k0 0.10 0.05 0.025 5.024

2.706 3.841

2 n ( ad - bc ) K2= (a+b)(c+d)(a+c)(b+d)

参照附表,得到的正确结论是(

)

A.在犯错误的概率不超过1%的前提下,认为“该市居民能否 做到‘光盘’与性别有关” B.在犯错误的概率不超过1%的前提下,认为“该市居民能否

做到‘光盘’与性别无关”
C.有90%以上的把握认为“该市居民能否做到‘光盘’与性 别有关” D.有90%以上的把握认为“该市居民能否做到‘光盘’与性 别无关”

解析

18+13+10-1 (1)由图表知, x = =10, 4

24+34+38+64 ^ x+ y= =40,又因为线性回归方程^ y =b 4 ^过样本点的中心( x , y ),所以 40=-2×10+a ^, a ^=60,所以线性回归方程^ 即a y=-2x+60, 所以当 x=-4 ℃时,^ y=-2×(-4)+60=68, 故应选 D.

(2)由公式可计算 K2 的观测值 n(ad-bc)2 k= (a+b)(c+d)(a+c)(b+d) 100×(45×15-30×10)2 = ≈3.03>2.706, 55×45×75×25 所以有 90%以上的把握认为“该市居民能否做到‘光盘’与 性别有关”,故选 C.

答案 (1)D (2)C

热点三 概率与统计的交汇 【例3】 某企业为了解下属某部门对本企业职工的服务情况, 随机访问50名职工,根据这50名职工对该部门的评分,绘制 频率分布直方图(如图所示),其中样本数据分组区间为[40,

50),[50,60),?,[80,90),[90,100].

(1)求频率分布直方图中a的值;
(2)估计该企业的职工对该部门评分不低于80的概率; (3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人 的评分都在[40,50)的概率. 解 (1)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a

=0.006.

(2) 由所给频率分布直方图知, 50 名受访职工评分不低于 80 的频
率为(0.022+0.018)×10=0.4. 所以该企业职工对该部门评分不低于80的概率的估计值为0.4.

(3)受访职工中评分在[50,60)的有:50×0.006×10=3(人),记 为 A1,A2,A3; 受访职工中评分在[40,50)的有:50×0.004×10=2(人),记为 B1,B2,

从这 5 名受访职工中随机抽取 2 人,所有可能的结果共有 10 种,它们是{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2, A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2}. 又因为所抽取 2 人的评分都在[40,50)的结果有 1 种, 1 即{B1,B2},故所求的概率为 P=10.

探究提高

概率试题的核心是概率计算,统计试题的核心是

样本数据的分布;概率与统计综合解答题的主要依托点是统

计图表,正确认识和使用这些图表是解决问题的关键,因此
在复习该部分时,要在这些图表上下工夫,把这些统计图表 的含义弄清楚,在此基础上掌握好样本的数字特征的计算方 法和各类概率的计算方法.解答此类试题时要做到:(1)读取图 表的数据要准确;(2)在计算古典概型概率时,基本事件的总

数要计算准确.

【训练3】 (2016· 北京昌平模拟)某校拟举办“成语大赛”,高
一 (1) 班的甲、乙两名同学在本班参加“成语大赛”选拔测 试,在相同的测试的条件下,两人5次测试的成绩(单位:分) 的茎叶图如图所示.

(1)你认为选派谁参赛更好?并说明理由; (2) 若从甲、乙两人 5 次的成绩中各随机抽取 1 次进行分析,

求抽到的2次成绩中至少有1次高于90分的概率.



58+55+76+88+92 (1) 由茎叶图可知,甲的平均成绩为 = 5

65+82+87+85+95 73.8(分), 乙的平均成绩为 =82.8(分), 乙的平 5 均成绩大于甲的平均成绩, 1 又甲的成绩的方差为 ×[(58 - 73.8)2 + (55 - 73.8)2 + (76 - 73.8)2 5
+(88-73.8)2+(92-73.8)2]=228.16, 1 乙的成绩的方差为 ×[(65 - 82.8)2 + (82 - 82.8)2 + (87 - 82.8)2 + 5 (85-82.8)2+(95-82.8)2]=97.76, 乙的成绩的方差小于甲的成绩的方差,因此选派乙参赛更好.

(2)设事件A:抽到的2次成绩中至少有1次高于90分.

从甲、乙两人5次的成绩中各随机抽取1次,所有的基本事件为
{58 , 65} , {58 , 82} , {58 , 87} , {58 , 85} , {58 , 95} , {55 , 65} , {55 , 82} , {55 , 87} , {55 , 85} , {55 , 95} , {76 , 65} , {76 , 82} , {76 , 87} , {76 , 85} , {76 , 95} , {88 , 65} , {88 , 82} , {88 , 87} , {88 , 85} , {88 , 95} , {92 , 65} , {92 , 82} , {92 , 87} , {92 , 85} , {92 , 95} , 共25个.

事件 A 包含的基本事件为 {58,95},{55,95},{76,95},{88,95}, {92,65},{92,82},{92,87},{92,85},{92,95}, 共 9 个. 9 所以 P(A)= ,即抽到的 2 次成绩中至少有 1 次高于 90 25 9 分的概率为 . 25

1.随机抽样的方法有三种,其中简单随机抽样适用于总体中 的个体数量不多的情况,当总体中的个体数量明显较多时 要使用系统抽样,当总体中的个体具有明显的层次时使用

分层抽样 . 系统抽样最重要的特征是“等距”,分层抽样
最重要的是各层的“比例”. 2.用样本估计总体 (1) 在频率分布直方图中,各小长方形的面积表示相应的 频率,各小长方形的面积的和为1.

(2) 众数、中位数及平均数的异同:众数、中位数及平均数 都是描述一组数据集中趋势的量,平均数是最重要的量. (3) 当总体的个体数较少时,可直接分析总体取值的频率分 布规律而得到总体分布;当总体容量很大时,通常从总体

中抽取一个样本,分析它的频率分布,以此估计总体分布.
1n ①总体平均值的估计,计算样本平均值 x = n ?x i.②总体方差 i=1 1n (标准差)的估计: 方差=n ? (xi- x )2, 标准差= 方差, 方差(标 i =1 准差)较小者较稳定.

^ x +a ^ 过样本点中心( x , y ),这为求 3.线性回归方程^ y =b 线性回归方程带来很多方便. 4.独立性检验 (1)作出 2×2 列联表.(2)计算随机变量 K2(χ2)的值. (3)查临界值,检验作答.


相关文档

(全国通用版)2019高考数学二轮复习专题三概率与统计第2讲统计与统计案例课件文
2019高考数学(文)二轮复习课件第二部分 专题六 概率与统计 第1讲 统计与统计案例
创新设计全国通用2017届高考数学二轮复习专题六概率与统计第2讲统计与统计案例训练文
创新设计全国通用2017届高考数学二轮复习专题六概率与统计第1讲概率课件文
2017年高考数学文二轮复习课件:专题整合突破 专题7 概率与统计 第2讲 统计与统计案例 2-7-2
2017届高考数学二轮复习第1部分专题七概率与统计2统计与统计案例课件文
【最新】高考数学二轮复习专题六概率与统计第1讲统计与统计案例课件文12143139
【导与练】(新课标)2016高考数学二轮复习 专题七 概率与统计 第2讲 统计与统计案例课件 文
全国通用2017届高考数学一轮总复习第十二章概率与统计12.5统计与统计案例课件理
电脑版