4.3.2 独立性检验 1.通过对典型案例的探究,了解独立性检验(只要求 2×2 列联表)的基本思想、方法及初步应用. 2.通过对数据的收集、整理和分析,增强学生的社会实践能力,培养学生分析问题、解决问题的能力. 重点:了解独立性检验(只要求 2×2 列联表)的应用. 难点:独立性检验(只要求 2×2 列联表)的基本思想、方法 独立性检验 1.如果随机事件 A 与 B 的样本数据的 2×2 列联表如下: 记 n=a+b+c+d.统计学中有一个非常有用的统计量 χ2(读作“卡方”). 总计 A B 总计 a b a+b c d c+d a+c b+d a+b+c+d 2 n ( ad - bc ) . 它的表达式是 χ = ( a+ b )( c+ d )( a+ c )( b+ d ) 2 2.任意给定一个 α(称为显著性水平,通常取为 0.05,0.01 等),可以找到满足条件 P(χ2≥k)=α 的数 k(称为 显著性水平 α 对应的分位数).χ2 是一个随机变量,其分布能够求出,上面的概率是可以计算的.因此,如 果根据样本数据算出 χ2 的值后,发现 χ2≥k 成立,就称在犯错误的概率不超过 α 的前提下,可以认为 A 与 B 不独立(也称为 A 与 B 有关);或说有 1-α 的把握认为 A 与 B 有关.若 χ2<k 成立,就称不能得到前述 结论.这一过程通常称为独立性检验. 3.A 与 B 独立时,也称为 A 与 B 无关.当 χ2<k 成立时,一般不直接说 A 与 B 无关,也就是说,独立性检验 通常得到的结果,或者是有 1-α 的把握认为 A 与 B 有关,或者没有 1-α 的把握认为 A 与 B 有关. 4.独立性的判断方法 (1)当 χ2<2.706 时,没有充分的证据判定变量 A,B 有关联,可以认为变量 A,B 是没有关联的; (2)当 χ2≥2.706 时,有 90%的把握判定变量 A,B 有关联; (3)当 χ2≥3.841 时,有 95%的把握判定变量 A,B 有关联; (4)当 χ2≥6.635 时,有 99%的把握判定变量 A,B 有关联. 1.分类变量 X 和 Y 的 2×2 列联表如下,则(  ) A.其他值一定时,ad-bc 越小,说明 X 与 Y 的关系越弱 B.其他值一定时,ad-bc 越大,说明 X 与 Y 的关系越强 C.其他值一定时,(ad-bc)2 越大,说明 X 与 Y 的关系越强 D.其他值一定时,(ad-bc)2 越接近于 0,说明 X 与 Y 的关系越强 Y1 Y2 总计 X1 a b a+b X2 c d c+d 总计 a+c b+d a+b+c+d 一、问题导学 问题 1. 任意抽取某市的一名学生,记 A:喜欢长跑,B:是女生. (1)你能得出 P(A),P(B), P(AB)这三者的准确值吗? (2)如果要判断 A 与 B 是否独立,该怎么办? 二、典例解析 例 1.为了了解阅读量多少与幸福感强弱之间的关系,一个调查机构得到了如下调查数据. 幸福感强 幸福感弱 总计 阅读量多 54 18 72 阅读量少 36 42 78 总计 90 60 150 根据调查数据回答,在犯错误的概率不超过 1%的前提下,可以认为阅读量多少与幸福感强弱有关 吗? 例 2 报刊对男女学生是否喜欢书法进行了一个随机调查,调查的数据如下表所示. 喜欢书法 不喜欢书法 男学生 24 32 女学生 16 24 根据调查数据回答:有 95%的把握认为性别与是否喜欢书法有关吗? 1.利用 χ2 进行独立性检验的步骤 (1)列表:列出 2×2 列联表; (2)求值:求出 χ2; (3)判断:与临界值比较,作出判断. 2.独立性检验的必要性 列联表中的数据是样本数据,它只是总体的代表,它具有随机性,所以只能利用列联表的数据和等高条 形图粗略判断两个分类变量是否有关系.而 χ2 给出了不同样本容量的数据的统一评判标准.利用它能 精确判断两个分类变量是否有关系的可靠程度. 跟踪训练 1.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了 361 名高二在校学生, 调查结果如下:理科对外语有兴趣的有 138 人,无兴趣的有 98 人,文科对外语有兴趣的有 73 人,无兴趣 的有 52 人.能否在犯错误的概率不超过 0.1 的前提下,认为“学生选报文、理科与对外语的兴趣有关”? 1.给出下列实际问题: ① 一种药物对某种病的治愈率;② 两种药物治疗同一种病是否有区别; ③ 吸烟者得肺病的概率;④ 吸烟是否与性别有关系; ⑤ 网吧与青少年的犯罪是否有关系.其中用独立性检验可以解决的问题有(  ) A.①②③ B.②④⑤ C.②③④⑤ D.①②③④⑤ 2.某班主任对全班 50 名学生进行了作业量多少的调查,数据如下表: 下列叙述中,正确的是(  ) A.有 99%的把握认为“喜欢玩电脑游戏与认为作业量的多少有关系” B.有 95%的把握认为“喜欢玩电脑游戏与认为作业量的多少无关系” C.有 99%的把握认为“喜欢玩电脑游戏与认为作业量的多少无关系” D.有 95%的把握认为“喜欢玩电脑游戏与认为作业量的多少有关系” 认为作业多 认为作业不多 总数 喜欢玩电脑游戏 18 9 27 不喜欢玩电脑游戏 8 15 23 总数 26 24 50 3.某高校《统计》课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 为了判断主修统 计专业是否与性别有关系,根据表中的数据,得到因为 4.844>3.841,所以有     的把握判定主修 统计专业与性别有关系.   专业 非统计专业 统计专业 男 13 10 女 7 20 性别   4.调查者通过询问 72 名男、女大学生在购买食品时是否看营养说明得到的数据如下表所示: 大学生的性别和是否看营养说明之间   (填“有”或“没有”)关系. 看营养说明 不看营养说明 总计 男大学生 28 8 36 女大学生 16 20 36 总计 44 28 72 5.随着工业化以及城市车辆的增加,城市的空气污染越来越严重,空气质量指数 API 一直居高不下,对 人体的呼吸系统造成了严重的影响.现调查了某市 500 名居民的工作场所和呼吸系统健康情况,得到 2×2 列联表如下: 室外工作 有呼吸系统疾病 总计 150 无呼吸系统疾病 总  计 室内工作 100 200 (1)补全 2×2 列联表; (2)能否在犯错误的概率不超过 0.05 的前提下认为感染呼吸系统疾病与工作场所有关? (3)现采用分层抽样从室内工作的居民中抽取一个容量为 6 的样本,将该样本看成一个总体,从中随机 地抽取两人,求两人都有呼吸系统疾病的概率. 参考答案: 知识梳理 n ( ad - bc )2 1.解析:由 χ = 可知,其他值一定的情况下,(ad-bc)2 ( a+ b )( c+ d )( a+ c )( b+ d ) 2 越大,则 χ2 的值越大,则 X 与 Y 的关系越强,故选 C. 答案:C 学习过程 问题 1.假设:通过调查,我们获取了下述数据:抽查了 110 人,其中女生有 50 人;且这 110 人中, 喜欢长跑的有 60 人,其中女生有 20 人.为了方便起见,请同学们把数据整理成表格形式.因为这个 表格中,核心的数据是中间的 4 个格子,所以这样的表格通常称为 2×2 列联表. 喜欢长跑 不喜欢长跑 总计 女 20 30 50 男 40 20 60 总计 60 50 110 60 6 = ; 则;喜欢长跑的概率 P( A) 可以估计为 110 11 是女生的概率 P( B) 50 5 = ; 可以估计为 110 11 20 2 AB ) = 喜欢长跑且是女生的概率 P ¿ 可以估计为 110 11 因为 P(A),P(B), P(AB)都是根据样本数据得到的估计值,而估计是有误差的,因此直接用 是否成立来判断 A 与 B 是否独立是不合理的. 但是,如果 A 与 B 独立,那么 P(A)P(B)应该可以作为 P(AB)的近似值.这是从统计意义上做出的 合理推断.即尽管随机性会对数据的准确性带来影响,但理论上,如果 A 与 B 是独立的,则这种影 响也一定不会太大。这是独立性检验的基本思想. 因此,从理论上可知,喜欢长跑的女生数可以怎样估计? 而实际上,喜欢长跑的女生数可以怎样表示? 问题:现在算出的  值 7.8 大于 6.635,所以若 A 与 B 独立,则该事件发生的概率是多少? 2 若 A 与 B 独立(即“喜欢长跑”与“是女生”独立 ),则我们观察到了一件概率不超过 1%的事件. 在犯错误的概率不超过 1%的前提下,可以认为“喜欢长跑”与“是女生”不独立(也称为是否喜欢长跑 与性别有关);或有 99%的把握认为是否喜欢长跑与性别有关. 上述 1%通常称为显著性水平,而 6.635 称为显著性水平 1%所对应的分位数. 一般情况下,如果随机事件 A 与 B 的样本数据的 2×2 列联表如下. B A Á 总计 a b a+b B́ c d c +d 总计 a+ c b+ d a+b +c +d 这四个数的和 2  n(ad  bc)2 (a  b)(c  d )(a  c )(b  d ) 不会太大. 例 1. 解:由题意可知 150� 54 �42  18 �36  675    �12.981 , 72 �78 �90 �60 52 2 2 又因为查表可得 P(  2 �6.635)  0.01 由于 12.918  6.631 所以在犯错概率不超过 1% 的前提下,可以认为阅读量多少与幸福感强弱有关. 例 2 解:由题意可知 (24+32+16+24) � 24 �24  16 �16  96    �0.078 , ()(16 24+32 �24)(24 + �16)(32 + � 24) + 1225 2 2 又因为 1-95%=5% ,而且查表可得 P (  2 �3.814)  0.05 0.078  3.814 所以没有 95% 的把握认为性别与是否喜欢书法有关., 跟踪训练 1.解:根据题目所给的数据得到如下列联表: 根据列联表中数据由公式计算得随机变量的观测值 因为 1.871×10-4<2.706,所以在犯错误的概率不超过 0.1 的前

docx文档 【新教材精创】 4.3.2 独立性检验 导学案- (人教B版 高二 选择性必修第二册)

教育频道 > 高中 > 数学 > 文档预览
8 页 0 下载 7 浏览 0 评论 0 收藏 3.0分
温馨提示:当前文档最多只能预览 5 页,若文档总页数超出了 5 页,请下载原文档以浏览全部内容。
本文档由 美到没朋友2022-11-09 16:00:00上传分享
给文档打分
您好可以输入 255 个字符
1+1=?( 答案:2 )
评论列表
  • 暂时还没有评论,期待您的金玉良言