欢迎来到高考学习网,

[登录][注册]

免费咨询热线:010-57799777

高考学习网
今日:1530总数:5885151专访:3372会员:401265
当前位置: 高考学习网 > 【课堂新坐标】2016-2017学年高二数学北师大版选修1-2学案:1.2.2 独立性检验+2.3 独立性检验的基本思想+2.4 独立性检验的应用

【课堂新坐标】2016-2017学年高二数学北师大版选修1-2学案:1.2.2 独立性检验+2.3 独立性检验的基本思想+2.4 独立性检验的应用

资料类别: 数学/学案

所属版本: 北师大版

所属地区: 全国

上传时间:2017/1/13

下载次数:200次

资料类型:

文档大小:435KB

所属点数: 0

普通下载 VIP下载 【下载此资源需要登录并付出 0 点,如何获得点?
2.2 独立性检验
2.3 独立性检验的基本思想
2.4 独立性检验的应用

1.了解独立性检验的基本思想方法.(重点)
2.了解独立性检验的初步应用.(难点)


[基础·初探]
教材整理1 独立性检验
阅读教材P21~P24第1行部分,完成下列问题.
设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=1;变量B:B1,B2=1,有下面2×2列联表:
BA   	B1	B2	总计		A1	a	b	a+b		A2	c	d	c+d		总计	a+c	b+d	n=a+b+c+d		其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.

某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
	文艺节目	新闻节目	总计		20至40岁	40	18	58		大于40岁	15	27	42		总计	55	45	100		由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).
【解析】 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.
【答案】 是
教材整理2 独立性检验的基本思想
阅读教材P24“练习”以下至P25“练习”以上部分,完成下列问题.
在2×2列联表中,令χ2=,当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:
(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;
(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;
(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;
(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.

对分类变量X与Y的统计量χ2的值说法正确的是(  )
A.χ2越大,“X与Y有关系”的把握性越小
B.χ2越小,“X与Y有关系”的把握性越小
C.χ2越接近于0,“X与Y无关系”的把握性越小
D.χ2越大,“X与Y无关系”程度越大
【解析】 χ2越大,X与Y越不独立,所以关联越大;相反,χ2越小,关联越小.
【答案】 B
[质疑·手记]
预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:
疑问1:___________________________________________________
解惑:___________________________________________________
疑问2:___________________________________________________
解惑:___________________________________________________
疑问3:___________________________________________________
解惑:___________________________________________________

[小组合作型]
,2×2列联表
 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系.
【精彩点拨】 →
→→

【自主解答】 2×2列联表如下:
	年龄在六
十岁以上	年龄在六
十岁以下	总计		饮食以蔬菜为主	43	21	64		饮食以肉类为主	27	33	60		总计	70	54	124		将表中数据代入公式得=≈0.671 875.
==0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.

1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.
2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.

[再练一题]
1.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.
【解】 作列联表如下:
    喜欢甜食情况
性别  	喜欢
甜食	不喜欢
甜食 	总计		男	117	413	530		女	492	178	670		总计	609	591	1 200		,独立性检验
 在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用. 

	未感冒	感冒	总计		使用血清	258	242	500		未使用血清	216	284	500 		总计	474	526	1 000		【精彩点拨】 独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.
【自主解答】 假设感冒与是否使用该种血清没有关系.
由列联表中的数据,求得χ2的值为χ2=≈7.075.
χ2=7.075≥6.635,
查表得P(χ2≥6.635)=0.01,
故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.

1.熟练掌握χ2统计量的数值计算,根据计算得出χ2值,对比三个临界值2.706,3.841和6.635,作出统计推断.
2.独立性检验的一般步骤:
(1)根据样本数据列2×2列联表;
(2)计算χ2=的值;
(3)将χ2的值与临界值进行比较,若χ2大于临界值,则认为X与Y有关,否则没有充分的理由说明这个假设不成立.

[再练一题]
2.“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下: 
	本地	外地	总计 		去年	1 407	2 842	4 249 		今年	1 331	2 065	3 396 		总计	2 738	4 907	7 645 		能否在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系?
【解】 按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系.
因为χ2=≈30.35>6.635.
所以在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系.
[探究共研型]
,独立性检验的综合应用
探究1 当χ2>3.841时,我们有多大的把握认为事件A与B有关?
【提示】 由临界值表可知当χ2>3.841时,我们有95%的把握认为事件A与B有关.
探究2 在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.我们是否可以判定100个心脏病患者中一定有打鼾的人?
【提示】 这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知100个心脏病患者中可能一个打鼾的人都没有.
 为了解某市创建文明城市过程中,学生对创建工作的满意情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建工作表示满意,有15名女生对创建工作表示不满意.已知在全部100名学生中随机抽取1人,其对创建工作表示满意的概率为.是否有充足的证据说明,学生对创建工作的满意情况与性别有关?
【精彩点拨】 解决本题首先根据对工作满意的概率,确定对工作满意的男女生人数,再画出2×2列联表,最后根据2×2列联表计算χ2,并进行判断.
【自主解答】 由题意得2×2列联表如下:
	满意	不满意	总计		男生	50	5	55		女生	30	15	45		总计	80	20	100		χ2=≈9.091>6.635,
所以我们有99%的把握认为学生对创建工作的满意情况与性别有关.

1.独立性检验的基本思想是:要确认两个变量有关系这一结论成立的可信程度,首先假设结论“两个变量没有关系”成立,在该假设下我们构造的统计量χ2应该很小,如果用观测数据计算的统计量χ2很大,则在一定程度上说明假设不合理.由χ2与临界值的大小关系,作出判断.
2.独立性检验仍然属于用样本估计总体,由于样本抽取具有随机性,因而作出的推断可能正确,也可能错误,有95%(或99%)的把握说事件A与B有关,则推断结论为错误的可能性仅为5%(或1%).

[再练一题]
3.有两个变量x与y,其一组观测值如下2×2列联表所示:
y
x 	y1	y2		x1	a	20-a		x2	15-a	30+a		其中a,15-a均为大于5的整数,则a取何值时,有95%的把握认为x与y之间有关系?
【解】 由题意χ2=
==.
有95%的把握认为x与y之间有关系,
χ2>3.841,
>3.841,a>7.7或a<1.5.
又a>5,15-a>5,7.76.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.
【答案】 C
3.在2×2列联表中,两个比值与________相差越大,两个分类变量有关系的可能性越大.
【解析】 根据2×2列联表可知,比值与相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.
【答案】 
4.以下关于独立性检验的说法中,正确的是________.
独立性检验依据小概率原理;
独立性检验得到的结论一定正确;
样本不同,独立性检验的结论可能有差异;
独立性检验不是判断两分类变量是否相关的唯一方法.
【解析】 独立性检验得到的结论不一定正确,故错,正确.
【答案】 
5.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
	喜欢甜品	不喜欢甜品	总计		南方学生	60	20	80		北方学生	10	10	20		合计	70	30	100		根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
【解】 将2×2列联表中的数据代入公式计算,得
χ2===≈4.762.
因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.

我还有这些不足:
(1)___________________________________
(2)___________________________________
我的课下提升方案:
(1)___________________________________
(2)___________________________________

学业分层测评(三) 
(建议用时:45分钟)
[学业达标]
一、选择题
1.有两个分类变量X与Y的一组数据,由其列联表计算得χ2≈4.523,则认为“X与Y有关系”犯错误的概率为(  )
A.95%  	B.90%  
C.5%  	D.10%
【解析】 χ2≈4.523>3.841.这表明认为“X与Y有关系”是错误的可能性约为0.05,即认为“X与Y有关系”犯错误的概率为5%.
【答案】 C
2.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是(  )
A.男、女患色盲的频率分别为0.038,0.006
B.男、女患色盲的概率分别为,
C.男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的
D.调查人数太少,不能说明色盲与性别有关
【解析】 男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为≈0.0676,差值较大.
【答案】 C
3.为了探究中学生的学习成绩是否与学习时间长短有关,在调查的500名学习时间较长的中学生中有39名学习成绩比较好,500名学习时间较短的中学生中有6名学习成绩比较好,那么你认为中学生的学习成绩与学习时间长短有关的把握为(  )
A.0 	B.95%
C.99% 	D.都不正确
【解析】 计算出χ2与两个临界值比较,
χ2=≈25.340  3>6.635.
所以有99%的把握说中学生的学习成绩与学习时间长短有关,故选C.
【答案】 C
4.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有________的把握认为糖尿病患者与遗传有关系.(  )
A.99.9% 	B.99.5%
C.99% 	D.97.5%
【解析】 可以先作出如下列联表(单位:人):
糖尿病患者与遗传列联表:
	糖尿病发病	糖尿病不发病	总计		阳性家族史	16	93	109		阴性家族史	17	240	257		总计	33	333	366		根据列联表中的数据,得到
χ2=≈6.067>5.024.
故我们有97.5%的把握认为糖尿病患者与遗传有关系.
【答案】 D
5.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
	y1	y2	总计		x1	a	b	a+b		x2	c	d	c+d		总计	a+c	b+d	a+b+c+d		以下各组数据中,对于同一样本能说明x与y有关系的可能性最大的一组为(  )
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=4,d=2
C.a=2,b=3,c=4,d=5
D.a=2,b=3,c=5,d=4
【解析】 比较.
选项A中,=;
选项B中,=;
选项C中,=;
选项D中,=.故选D.
【答案】 D
二、填空题
6.调查者通过随机询问72名男女中学生喜欢文科还是理科,得到如下列联表(单位:名):
性别与喜欢文科还是理科列联表:
	喜欢文科	喜欢理科	总计		男生	8	28	36		女生	20	16	36		总计	28	44	72		中学生的性别和喜欢文科还是理科________关系.(填“有”或“没有”)
【解析】 通过计算χ2=≈8.42>7.879.
故我们有99.5%的把握认为中学生的性别和喜欢文科还是理科有关系.
【答案】 有
7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 
  专业
性别  	非统计专业	统计专业		男	13	10		女	7	20		为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
χ2=≈4.844,
因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.
【解析】 χ2>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.
【答案】 5%
8.在吸烟与患肺病是否相关的判断中,有下面的说法:
若统计量χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
由独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;
由独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.
其中说法正确的是________.(填序号)
【解析】 统计量χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法错误;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确.
【答案】 
三、解答题
9.某班主任对班级22名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.
(1)根据以上数据建立一个2×2列联表;
(2)试问喜欢电脑游戏与认为作业多少是否有关系?
【解】 由题意列出2×2列联表:
	认为作业多 	认为作业不多	总计		喜欢玩电脑游戏 	10	2	12		不喜欢玩电脑游戏	3	7	10		总计	13	9	22		(2)由公式得:
χ2=≈6.418,
6.418>3.841,有95%的把握认为玩电脑游戏与认为作业多少有关系.
10.在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞行航程中,男乘客是否比女乘客更容易晕机?
【解】 根据题意,列出2×2列联表如下:
	晕机	不晕机	总计		男乘客	24	31	55		女乘客	8	26	34		总计	32	57	89		由公式可得χ2=≈3.689>2.706,
故我们有90%的把握认为“在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机”.
[能力提升]
1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
	男	女	总计		爱好	40	20	60		不爱好	20	30	50		总计	60	50	110		由χ2=算得,
χ2=≈7.8.
附表:
P(χ2≥k0)	0.050	0.010	0.001		k	3.841	6.635	10.828		参照附表,得到的正确结论是(  )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
【解析】 根据独立性检验的思想方法,正确选项为C.
【答案】 C
2.某班主任对全班50名学生进行了作业量的调查,数据如下表:
	认为作业量大	认为作业量不大	总计		男生	18	9	27		女生	8	15	23		总计	26	24	50		若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过(  )
A.0.01      	B.0.025
C.0.10 	D.0.05
【解析】 χ2=≈5.059>5.024,因为P(χ2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.
【答案】 B
3.某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过________的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.
	超重	不超重	总计		偏高	4	1	5		不偏高	3	12	15		总计	7	13	20		【解析】 根据公式χ2=得,χ2=≈5.934,
因为χ2>5.024,因此在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.
【答案】 0.025
4.(2016·沈阳二检)为了研究“教学方式”对教学质量的影响,某高中数学老师分别用两种不同的教学方式对入学数学平均分数和优秀率都相同的甲、乙两个高一新班进行教学(勤奋程度和自觉性都一样).以下茎叶图为甲、乙两班(每班均为20人)学生的数学期末考试成绩.
甲		乙							0	9	0	1	5	6	8							7	7	3	2	8	0	1	2	5	6	6	8	9		8	4	2	2	1	0	7	1	3	5								9	8	7	7	6	6	5	7	8	9								8	8	7	7	5										图1­2­4
(1)现从甲班数学成绩不低于80分的同学中随机抽取两名同学,求成绩为87分的同学至少有一名被抽中的概率;
(2)学校规定:成绩不低于75分的为优秀.请填写下面的2×2列联表,并判断有多大把握认为“成绩优秀与教学方式有关”.
	甲班	乙班	总计		优秀					不优秀					总计					
下面临界表仅供参考:
P(χ2≥k)	0.15	0.10	0.05	0.025	0.010	0.005	0.001		k	2.072	2.706	3.841	5.024	6.635	7.879	10.828		
【解】 (1)记成绩为87分的同学为A,B,其他不低于80分的同学为C,D,E,“从甲班数学成绩不低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共10个.
“至少有一个87分的同学被抽到”所组成的基本事件有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共7个,所以P=.
(2)
	甲班	乙班	总计		优秀	6	14	20		不优秀	14	6	20		总计	20	20	40		χ2==6.4>5.024,
因此,我们有97.5%的把握认为成绩优秀与教学方式有关.













高考学习网-中国最大高考学习网站Gkxx.com | 我们负责传递知识!


































本网部分资源来源于会员上传,除本网组织的资源外,版权归原作者所有,如有侵犯版权,请联系并提供证据(kefu@gkxx.com),三个工作日内删除。

精品专题more

友情链接:初中学习网人民网高考网易高考高中作文网新东方冬令营