88教案网

你的位置: 教案 > 高中教案 > 导航 > 用样本的频率分布估计总体分布

小学健康的教案

发表时间:2020-11-12

用样本的频率分布估计总体分布。

一名优秀的教师在每次教学前有自己的事先计划,高中教师要准备好教案,这是教师工作中的一部分。教案可以让学生们能够在上课时充分理解所教内容,帮助高中教师提高自己的教学质量。怎么才能让高中教案写的更加全面呢?下面是由小编为大家整理的“用样本的频率分布估计总体分布”,大家不妨来参考。希望您能喜欢!

1.6用样本的频率分布估计总体分布1
一、教学目标:1、知识与技能:(1)通过实例体会分布的意义和作用。(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。2、过程与方法:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。3、情感态度与价值观:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
二、重点与难点:重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
难点:能通过样本的频率分布估计总体的分布。
三、教学方法:探究归纳,思考交流
四、教学设想
(一)、创设情境
在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?
如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。
(二)、探究新知〖探究〗:P55
我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)
为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。(如课本P56)
分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式。
下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。
1、频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:计算一组数据中最大值与最小值的差,即求极差(1)决定组距与组数;⑵将数据分组;⑶列频率分布表;⑷画频率分布直方图。
以课本P56制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。(让学生自己动手作图)
频率分布直方图的特征:⑴从频率分布直方图可以清楚的看出数据分布的总体趋势。⑵从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
〖探究〗:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图不同的看法进行交流……)
接下来请同学们思考下面这个问题:〖思考〗:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见课本P57)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)
2、频率分布折线图、总体密度曲线
(1).频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
(2).总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。(见课本P60)
〖思考〗:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?
实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.
3、茎叶图
(1).茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本P61例子)
(2).茎叶图的特征:①用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。②茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。
(三)、例题精析:〖例1〗:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.。分析:根据样本频率分布表、频率分布直方图的一般步骤解题。
解:(1)样本频率分布表如下:

(2)其频率分布直方图如下:JAb88.CoM

(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.
〖例2〗:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1。
解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:又因为频率=
所以
(2)由图可估计该学校高一学生的达标率约为
(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。
(四)课堂精练:P61练习1.2.3
(五)、课堂小结:1、总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。2、总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
(六)作业:1.P72习题2.2A组1、2
五、教后反思:

相关推荐

高中数学必修三导学案:2.2.1用样本的频率分布估计总体分布(1)


古人云,工欲善其事,必先利其器。作为高中教师就要精心准备好合适的教案。教案可以让学生更好的吸收课堂上所讲的知识点,有效的提高课堂的教学效率。那么,你知道高中教案要怎么写呢?下面是小编精心为您整理的“高中数学必修三导学案:2.2.1用样本的频率分布估计总体分布(1)”,希望对您的工作和生活有所帮助。

2.2.1用样本的频率分布估计总体分布(1)
【学习目标】
1.了解频率分布的意义,了解什么是频率分布表,了解频率分布直方图的意义和折线图和密度曲线的意义;
2.掌握编制频率分布表的方法和作频率分布直方图的方法.并能准确应用频率分布直方图解决有关问题.
3.培养动手操作能力,体会统计思想的应用.

【新知自学】
阅读教材第65-69页内容,然后回答问题

知识回顾:
我们学习的随机抽样方法有哪些?它们分别适用于什么样的总体,如何具体实施?
新知梳理:
1、数据分析的基本方法
分析数据的一种基本方法是用将它们画出来,或者用紧凑的表格改变数据的排列方式.作图可以达到两个目的,一是从数据中信息,二是利用图形信息;表格则是通过改变数据的,为我们提供解释数据的新方式.
2、频率分布
样本中所有数据(或者数据组)的和的比,就是该数据的频率.所有数据(或者数据组)的频率的分布,可以用、
、频率分布折线图、茎叶图等来表示.
3、频率分布直方图
在频率分布直方图中,纵轴表示,数据落在各小组内的频率用表示,各小长方形的面积的总和等于.
探究:画频率分布直方图的步骤?
⑴求极差.即一组数据中最大值和最小值的差.
⑵决定组距与组数
①组距与组数的确定没有固定的标准,常常需要一个尝试与选择的过程.
②组距和样本容量有关,一般样本容本越大,分的组也越多.当样本容量不超过100时,按照数据的多少,常分为5~12组.
③极差、组距、组数之间有如下关系:
设组数,若则组数为;若则组数为大于的最小整数.
⑶将数据分组
按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.
⑷列频率分布表
一般分为四列:,最后频数合计应是样本容量,频率合计应是1.
⑸画频率分布直方图
画图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,其相应组距上的频率应该等于该的面积,即每个矩形的面积=.

【感悟】频率分布直方图能够容易的表示大量数据,非常直观的表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式。但是,直方图本身得不出原始数据内容,也就是说把数据表示成直方图后,原有的具体数据信息就被抹掉了.
4、频率分布折线图与总体密度曲线
连接频率分布直方图中,各小长方形上端的中点,就得到频率分布折线图.随着的增加,作图时所分的也在增加,相应的频率分布折线图就会越来越接近于一条,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
对点练习:
1.在频率分布直方图中,小矩形的高表示().
A.频率/样本容量B.组距×频率
C.频率D.频率/组距
2.一个容量为20的样本,分组与频数为:
2个、(20,30]3个、
(30,40]4个、(40,50]5个、
(50,60]4个、(60,70]2个,则样本数据在区间(-∞,50]上的可能性为()
A.5%B.25%
C.50%D.70%
3.200辆汽车通过某一路段时时速频率分布直方图如图所示,则时速在[50,60]的汽车大约有_____辆.

【合作探究】
典例精析
例题1.调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171163163166166168168160168165
171169167169151168170168160174
165168174159167156157164169180
176157162161158164163163167161
(1)作出频率分布表;
(2)画出频率分布直方图.

变式训练1.为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110cm的株数大约是()
A.3000B.6000
C.7000D.8000

例题2.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
(1)列出样本频率分布表﹔
(2)一画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分.

变式训练2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.

【课堂小结】

【当堂达标】
1.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()
A.20%B.69%C.31%D.27%

2.对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如上图所示,由图可知,这一批电子元件中使用寿命在100~300h的电子元件的数量与使用寿命在300~600h的电子元件的数量的比是()
A.12B.13C.14D.16
3.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图(如图所示).已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是____________,成绩优秀的频率是____________.

【课时作业】
1.容量为20的样本,分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本在(-∞,50]上的频率为()
A.B.C.D.

2.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,数0.4是指1号球占总体分布的()
A.频数B.频率
C.频率/组距D.累计频率

3.样本:12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么频率为0.25的样本的范围是()
A.[5.5,7.5)B.[7.5,9.5)
C.[9.5,11.5)D.[11.5,13.5)
4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:
根据下图可得这100名学生中体重在〔56.5,64.5〕
的学生人数是()
A.20B.30C.40D.50

5.从高三学生中抽取50名同学参加知识竞赛,成绩分组及各组的频数如下:(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.
(1)列出样本频率分布表(含累积频率);
(2)画出频率分布直方图;
(3)估计成绩在[60,90)内学生的频率.

6.如右下图是一个样本的频率分布直方图,且在[15,18)内频数为8.
(1)求样本容量;
(2)若[12,15)一组的小长方形面积为0.06,求[12,15)一组的频数;
(3)求样本在[18,33)内的频率.

高中数学必修三导学案2.2.1用样本的频率分布估计总体分布(2)


2.2.1用样本的频率分布估计总体分布(2)
【学习目标】
1.进一步熟悉用样本的频率分布估计总体分布的方法,明确其意义及优缺点.
2.了解茎叶图的意义,掌握制作茎叶图的方法.

【新知自学】
用频率分布直方图和折线图表示频率分布时,直方图能以面积的形式反映数据落在各小组的频率的大小;折线图能直观反映数据的变化趋势.但都不够精确,没有保留原始数据.
1.茎叶图的特点
当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以,
而且可以,给数据的和都带来了方便.
2.画茎叶图的步骤:
1)将每个数据分为茎(高位)和叶(低位)两部分.在课本第70页甲乙两运动员的得分记录的列表分布中,茎为十位上的数字,叶为个位上的数字.
2)将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;
3)将各个数据的叶按大小次序写在其经右(左)侧.
注:一般来说,当数据是两位数时,十位数字作茎,个位数字作叶;如果数据是由整数部分和小数部分组成的,可把整数部分作茎,小数部分作叶.其他情况可灵活划分.
【感悟】利用茎叶图刻画数据有何优点?作茎叶图时应该注意什么?
答:用茎叶图刻画数据有两个优点:一是它所有的信息都可以从茎叶图中找到;二是茎叶图便于记录和表示,能够展示数据的分布情况.但当数据较多或数据位数较多时,茎叶图就显得不太方便了.茎叶图可以分析单组数据,也能对两组数据进行比较,画出两组数据的茎叶图,可将茎放在中间共用,叶分列左、右两侧,左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的得分要重复记录,不能遗漏.
对点练习.
1.茎叶图刻画数据有两个优点:一是_____________________,二是________________.
2.下列关于茎叶图的叙述正确的是()
(A)茎叶图可以展示未分组的原始数据,它与频率分布表以及频率分布直方图的处理方式不同
(B)对于重复的数据,只算一个
(C)茎叶图中的叶是“茎”十进制的上一级
(D)制作茎叶图的程序:第一步画出茎;第二步画出叶;第三步将“叶子”任意排列
3.在某五场篮球比赛中,甲、乙两名运动员得分的茎叶图如下.下列说法正确的是()
(A)在这五场比赛中,甲的平均得分比乙好,且甲比乙稳定
(B)在这五场比赛中,甲的平均得分比乙好,但乙比甲稳定
(C)在这五场比赛中,乙的平均得分比甲好,且乙比甲稳定
(D)在这五场比赛中,乙的平均得分比甲好,但甲比乙稳定
4.2007年在广州举行的全国少数民族运动会上,七位评委为某民族舞蹈打出的分数的
茎叶图(如图),去掉一个最高分和一个最低分后,所剩数据的平均数为().
(A)84(B)82
(C)(D)86

【合作探究】
典例精析
例题1.篮球运动员在2005赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.制作茎叶图,并分析这个运动员的整体水平及发挥的稳定程度.

变式训练1.甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得分水平
甲:12,15,24,25,31,31,36,36,37,39,44,49,50
乙:8,13,14,16,23,26,28,33,38,39,51

例题2:某中学甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.

变式训练2.2012年的NBA全明星赛于美国当地时间2012年2月26日在佛罗里达州奥兰多市举行.如图是参加此次比赛的甲、乙两名篮球运动员以往几场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是________.

【课堂小结】

【当堂达标】
1.某校开展“爱我平邑、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示。记分员在去掉一个最高分和一个最低分后,算的平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清。若记分员计算无误,则数字应该是___________

2.某篮球学校的甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如下.则罚球命中率较高的是.

【课时作业】
1.右边茎叶图中所记录的原始数据共有个.

2.抽取高二某班其中20名同学,记录各位同学一分钟脉搏次数,其茎叶图如下,左端的数字表示脉搏次数的十位数,则这些同学一分钟脉搏次数的平均数、众数、中位数分别是、、.

586
64017
722368256
814620
90

3.甲、乙两个班各随机选出15名同学进行测验,成绩的茎叶图如图.
则甲、乙两个班的最高成绩各是_______________,从图中看,________班的平均成绩最高.
4.有两个班级,每班各自按学号随机选出10名学生,测验铅球成绩,以考查体育达标程度,测验成绩如下:单位(米)
两个班相比较,哪个班整体实力强一些?
序号12345
甲9.17.98.46.95.2
乙8.88.57.37.16.7
序号678910
甲7.28.08.16.74.9
乙8.49.88.76.85.9

5.名著《飘》的中英文版本中,第一节的部分内容的每句句子中所含单词(字)数
如下:
英文句子所含单词数:10,52,56,40,79,9,23,11,10,21,30,31;
中文句子所含字数:11,79,7,20,63,33,45,36,87,9,11,37,17,18,71,75.
(1)作出这些数据的茎叶图;
(2)比较茎叶图,你能得到什么结论.

6.下面一组数据是某生产车间30名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,并由图说明以下这个车间次日的生产情况.
134112117126128124122
116113107116132127128
126121120118108110133
130124116117123122120
112112

7.有一种鱼的身体吸收汞,汞的含量超过体重的1.00ppm(即百万分之一)时就会对人体产程危害.在30条鱼的样本中发现的汞含量是
0.070.240.950.981.020.98
1.371.400.391.021.441.58
0.541.080.610.721.201.14
1.621.681.851.200.810.82
0.841.291.262.100.911.31
(1)用前两位数作为茎,画出样本数据的茎叶图;
(2)描述一下汞含量的分布特点;
(3)从实际情况看,许多鱼的汞含量超标在于有些鱼在出售之前没有被检查过.每批这种鱼的汞含量都比1.00ppm大吗?

第2节第1课时用样本的频率分布估计总体分布教学案


第1课时用样本的频率分布估计总体分布
[核心必知]
1.预习教材,问题导入
根据以下提纲,预习教材P65~P70,回答下列问题.
(1)画频率分布直方图的步骤有哪些?
提示:求极差→决定组距与组数→决定组距与组数→将数据分组→列频率分布表→画频率分布直方图.
(2)频率分布直方图的纵轴表示什么?各矩形面积之和等于什么?
提示:频率分布直方图的纵轴表示频率/组距,各小长方形面积之和为1.
(3)频率分布折线图和总体密度曲线各指什么?
提示:连接频率分布直方图中各小长方形上端的中点就得到频率分布折线图;当频率分布直方图中组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑的曲线,称之为总体密度曲线.
2.归纳总结,核心必记
(1)用样本估计总体、数据分析的基本方法
①用样本估计总体的两种情况
(ⅰ)用样本的频率分布估计总体分布.
(ⅱ)用样本的数字特征估计总体的数字特征.
②数据分析的基本方法
(ⅰ)借助于图形
分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.
(ⅱ)借助于表格
分析数据的另一种方法是用紧凑的表格改变数据的排列方式,此方法是通过改变数据的构成形式,为我们提供解释数据的新方式.
(2)绘制频率分布直方图的步骤
(3)频率分布折线图和总体密度曲线
(4)茎叶图
①茎叶图的制作方法(以两位数据为例):
将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出.
②茎叶图的优缺点
在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,茎叶就会很长.
[问题思考]
(1)频率分布直方图直观形象地表示了频率分布表,在频率分布直方图中是用哪些量来表示各组频率的?
提示:在频率分布直方图中用每个矩形的面积表示相应组的频率,即频率组距×组距=频率,各组频率的和等于1,因此各小矩形的面积的和等于1.
(2)茎叶图中对“叶”和“茎”有什么要求?
提示:茎叶图中,“叶”是数据的最后一个数字,其前面的数字作为“茎”.
[课前反思]
通过以上预习,必须掌握的几个知识点:
(1)绘制频率分布直方图的步骤:;
(2)频率分布折线图和总体密度曲线的制作方法:;
(3)茎叶图的制作方法:.
[思考]频率分布表、频率分布直方图各有什么优缺点?
名师指津:(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.
(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
?讲一讲
1.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
[尝试解答]以4为组距,列表如下:
频率分布直方图如图(1)所示,频率分布折线图如图(2)所示.
(1)频率分布表中极差、组距、组数的关系
①若极差组距为整数,则极差组距=组数;
②若极差组距不为整数,则极差组距的整数部分+1=组数.
(2)确定频率分布直方图中组距和组数的注意点
组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.
?练一练
1.有一容量为50的样本,数据的分组及各组的数据如下:[10,15),4;[15,20),5;[20,25),10;[25,30),11;[30,35),9;[35,40),8;[40,45],3.
(1)列出样本频率分布表;
(2)画出频率分布直方图及折线图.
解:(1)由所给的数据,不难得出以下样本的频率分布表:
数据段[10,15)[15,20)[20,25)[25,30)
频数451011
频率0.080.100.200.22
数据段[30,35)[35,40)[40,45]总计
频数98350
频率0.180.160.061
(2)频率分布直方图如图(1)所示,频率分布折线图如图(2)所示.
观察下面茎叶图,它的中间部分像一棵树的茎,两边部分像这棵树的茎上长出来的叶子.
[思考]怎样理解认识茎叶图?
名师指津:茎叶图也是用来表示数据的一种图,它的思路是将数组中的数按位数进行比较,将高位数字作为一个主干(茎),将低位数字作为分枝(叶),列在主干的一侧,这样就可以清楚地看到每个主干后面有几个数,每个数具体是多少.
?讲一讲
2.某赛季甲、乙两名篮球运动员每场比赛得分情况如下:
甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;
乙的得分:8,13,14,16,23,26,28,33,38,39,51.
(1)画出甲、乙两名运动员得分数据的茎叶图;
(2)根据茎叶图分析甲、乙两运动员的水平.
[尝试解答](1)作出茎叶图如图所示:
(2)由(1)中的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.
画茎叶图的步骤
第一步,将数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将表示“茎”的数字按大小顺序由上到下排成一列;第三步,将各个数据的“叶”按次序写在其茎的左、右两侧.
?练一练
2.甲、乙两名同学最近几次的数学考试成绩情况如下:
甲的得分:95,81,75,89,71,65,76,88,94,110,107;
乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解:甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.
?讲一讲
3.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)求直方图中x的值;
(2)在这些用户中,求用电量落在区间[100,250)内的户数.
[思路点拨](1)根据各小长方形的面积和为1求解.
(2)先求数据落在[100,250)内的频率,再由频率公式求值.
[尝试解答](1)由频率分布直方图知[200,250)小组的频率为1-(0.0024+0.0036+0.0060+0.0024+0.0012)×50=0.22,于是x=0.2250=0.0044.
(2)∵数据落在[100,250)内的频率为
(0.0036+0.0060+0.0044)×50=0.7,
∴所求户数为0.7×100=70.
频率分布直方图的性质
(1)每个小矩形的面积表示样本数据落在该组内的频率.
(2)所有小矩形的面积和等于1.
(3)利用一组的频数和频率,可以求样本容量.
提醒:频率分布直方图中的纵轴不是频率,而是频率/组距.
?练一练
3.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
解:(1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.
又因为第二小组的频率=第二小组的频数样本容量,
所以样本容量=第二小组的频数第二小组的频率=120.08=150.
(2)由直方图可估计该校高一年级学生的达标率为
17+15+9+32+4+17+15+9+3×100%=88%.
——————————————[课堂归纳感悟提升]———————————————
1.本节课的重点是会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,难点是理解用样本的频率分布估计总体分布的方法.
2.本节课要重点掌握的规律方法
(1)绘制频率分布直方图的步骤,见讲1.
(2)绘制茎叶图的步骤及其意义,见讲2.
(3)会应用频率分布直方图的意义解决问题,见讲3.
3.本节课的易错点
将频率分布直方图中的纵轴的单位看错而致错是本节课的主要易错点,如讲3.
课下能力提升(十二)
[学业水平达标练]
题组1列频率分布表、画频率分布直方图
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是()
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
解析:选C由用样本估计总体的性质可得.
2.在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是()
A.15B.16
C.110D.不确定
解析:选A该组的频率为1050=15,故选A.
3.调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171163163166166168168160168165
171169167169151168170168160174
165168174159167156157164169180
176157162161158164163163167161
(1)作出频率分布表;
(2)画出频率分布直方图.
解:(1)最低身高151cm,最高身高180cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:
分组频数频率
[149.5,153.5)10.025
[153.5,157.5)30.075
[157.5,161.5)60.15
[161.5,165.5)90.225
[165.5,169.5)140.35
[169.5,173.5)30.075
[173.5,177.5)30.075
[177.5,181.5]10.025
合计401
(2)频率分布直方图如图所示.
题组2茎叶图及应用
4.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()
A.0.2B.0.4C.0.5D.0.6
解析:选B∵数据总个数n=10,又落在区间[22,30)内的数据个数为4,∴所求的频率为410=0.4.故选B.
5.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()
A.46,45,56B.46,45,53
C.47,45,56D.45,47,53
解析:选A直接列举求解.由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.
题组3频率分布直方图的应用
6.(2016金华高一检测)如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为()
A.20B.30C.40D.50
解析:选B样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
7.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).
分组频数频率
一组0≤t500
二组5≤t10100.10
三组10≤t1510②
四组15≤t20①0.50
五组20≤t≤25300.30
合计1001.00
解答下列问题:
(1)这次抽样的样本容量是多少?
(2)在表中填写出缺失的数据并补全频率分布直方图;
(3)旅客购票用时的平均数可能落在哪一组?
解:(1)样本容量是100.
(2)①50②0.10
所补频率分布直方图如图中的阴影部分.
(3)设旅客平均购票用时为tmin,则有
0×0+5×10+10×10+15×50+20×30100≤t
5×0+10×10+15×10+20×50+25×30100,
即15≤t20.所以旅客购票用时的平均数可能落在第四组.
[能力提升综合练]
1.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:
组号12345678
频数101314141513129
第3组的频率和累积频率为()
A.0.14和0.37B.114和127
C.0.03和0.06D.314和637
解析:选A由表可知,第三小组的频率为14100=0.14,累积频率为10+13+14100=0.37.
2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()
AB
CD
解析:选A由分组可知C,D两项一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,∴第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.
3.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地10000名居民进行了调查,并根据所得数据画出了样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从10000人中再用分层抽样的方法抽出100人做进一步调查,则在[2.5,3)(小时)时间段内应抽出的人数是()
A.25B.30C.50D.75
解析:选A抽出的100人中平均每天看电视的时间在[2.5,3)(小时)时间段内的频率是0.5×0.5=0.25,所以这10000人中平均每天看电视时间在[2.5,3)(小时)时间段内的人数为10000×0.25=2500,又抽样比为10010000=1100,故在[2.5,3)(小时)时间段内应抽出人数为2500×1100=25.
4.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()
A.90B.75C.60D.45
解析:选A∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.
5.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图:
据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.
解析:在抽取的20名教师中,在[15,25)内的人数为6,据此可估计该校上学期200名教师中,使用多媒体进行教学的次数在[15,25)内的人数为60.
答案:60
6.在我市2016年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则分数在区间[60,70)上的人数大约有________.
解析:根据频率分布直方图,分数在区间[60,70)上的频率为0.04×10=0.4,∴分数在区间[60,70)上的人数为200×0.4=80.
答案:80
7.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
解:(1)
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物更加通俗易懂、简单明了.
8.某市2016年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,
45.
(1)完成频率分布表;
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解:(1)频率分布表:
分组频数频率
[41,51)2230

[51,61)1130

[61,71)4430

[71,81)6630

[81,91)101030

[91,101)5530

[101,111]2230

(2)频率分布直方图如图所示.
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.
②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.

2.2.2用样本的数字特征估计总体的数字特征


2.2.2用样本的数字特征估计总体的数字特征
教学目标:
知识与技能
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观
会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
重点与难点
重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
教学设想
【创设情境】
在一次射击比赛中甲、乙两名运动员各射击次,命中环数如下﹕
甲运动员﹕,,,,,,,,,;
乙运动员﹕,,,,,,,,,
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征(板出课题)。
【探究新知】
一、众数、中位数、平均数
〖探究〗:P62
(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?
(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)
初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。例如前面一节在调查位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是(最高的矩形的中点)(图略见课本第页)它告诉我们,该市的月均用水量为的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
〖提问〗:请大家翻回到课本第页看看原来抽样的数据,有没有这个数值呢?根据众数的定义,怎么会是众数呢?为什么?(请大家思考作答)
分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而是由样本数据的频率分布直方图得来的,所以存在一些偏差。
〖提问〗:那么如何从频率分布直方图中估计中位数呢?
分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等。由此可以估计出中位数的值为。(图略见课本63页图)
〖思考〗:这个中位数的估计值,与样本的中位数值不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)
(课本63页图)显示,大部分居民的月均用水量在中部(左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的。
〖思考〗:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)
二、标准差、方差
1.标准差
平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。因此,只有平均数难以概括样本数据的实际状态。
例如,在一次射击选拔比赛中甲、乙两名运动员各射击次,命中环数如下﹕
甲运动员﹕,,,,,,,,,;
乙运动员﹕,,,,,,,,,
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?
我们知道,。
两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?(观察P66图2.2-8)直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。
考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。
样本数据的标准差的算法:
(1)、算出样本数据的平均数。
(2)、算出每个样本数据与样本数据平均数的差:
(3)、算出(2)中的平方。
(4)、算出(3)中n个平方数的平均数,即为样本方差。
(5)、算出(4)中平均数的算术平方根,,即为样本标准差。
其计算公式为:

显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
〖提问〗:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
从标准差的定义和计算公式都可以得出:。当时,意味着所有的样本数据都等于样本平均数。
(在课堂上,如果条件允许的话,可以给学生简单的介绍一下利用计算机来计算标准差的方法。)
2.方差
从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样本数据分散程度的工具:

在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
【例题精析】
〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5
(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7
(4)2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。
解:(图略,可查阅课本P68)
四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
〖例2〗:(见课本P69)
分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。
【课堂精练】
P71练习1.2.34
【课堂小结】
1.用样本的数字特征估计总体的数字特征分两类:
a)用样本平均数估计总体平均数。
b)用样本标准差估计总体标准差。样本容量越大,估计就越精确。
2.平均数对数据有“取齐”的作用,代表一组数据的平均水平。
3.标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。
【评价设计】
1.P72习题A组3、4、10