吕建聚++张艳
DOI:10.16660/j.cnki.1674-098X.2017.25.233
摘 要:假设检验是工科概率统计教学过程中学生反映比较难懂的章节。本文就假设检验原理理解中的一些难点和模糊点,给出了进一步的解释,目的是使学生更加清晰地理解知识,进一步提高学生的分析问题和解决问题的实践创新能力。
关键词:假设检验 否定域 原假设 备择假设
中图分类号:G71 文献标识码:A 文章编号:1674-098X(2017)09(a)-0233-02
Abstract: Hypothesis testing is a difficult chapter in the teaching of probability and statistics in engineering. This paper gives a further explanation about some difficulties and fuzzy points in understanding the test principle. The purpose is to make students more clearly understand the knowledge, to further improve the students' ability of analyzing and solving problems.
Key Words: Hypothesis testing; Critical region; Null hypothesis; Alternative hypothesis
假设检验是概率论与数理统计课程中的教学重点和难点。由于这部分内容包含了丰富的思想和原理,公式很多,初学者常常觉得晕头转向、内容深不可测,大部分学生只能死记硬背公式,应付考试;由于课时有限,教师在课堂上也不可能充分讲深讲透。本文针对以上问题对教学过程中的一些难点和模糊点,谈一些自己的认识和教学体会。
1 检验统计量及否定域的构造思想及方法
检验统计量及否定域的构造是假设检验的核心工作和难点。用通俗的语言來说,否定域就是否定原假设的条件,归纳起来必须满足两条:一是观察到的样本对原假设不支持,或者说出现了相对于原假设成立的不合理现象,二是,这种不合理要非常明显,用概率的语言来说,就是出现几乎不可能发生的小概率事件。这两条之中,寻找不合理现象是工作的方向,而不合理的标准可以根据研究对象人为设定。基于以上理解,构造否定域分3个步骤:
第一步,选择一个和被检验对象贴近度高的检验统计量,在原假设成立的前提下可以直观看出检验统计量的大致取值规律。
关于单个正态总体均值μ的单边、双边检验中,可选用统计量,因为是μ一个良好的无偏估计,与μ同向增减;同理,两个正态总体的均值差μ1-μ2的有关检验当中,可以选用统计量;总体方差有关的检验可以选用样本标准差S2。
为了计算概率,必要时对初步选定的统计量进行简单加工,得到分布已知的统计量。
第二步,假定原假设成立,分析拟用统计量取值不合理的情景,对于统计量不合理的取值有一个定性的认识。
第三步,根据对不合理程度的要求,选定一个阈值,即显著性水平来作为检验标准,于是可得否定域。
具体来看正态总体均值μ的右边检验,第一步,选用作为检验统计量;第二步,分析在什么情景下不合理,原假设成立的情景下,通常要比μ0小一些,如果比μ0大很多,就是明显的不合理;第三步,设定出一个标准值k,成立就否定原假设。
为了解题过程标准化和增加可比性,可将进行再加工,在未知时,用作为检验统计量,T是的线性函数,T值很大就不合理,≥作为否定原假设的条件即否定域,α为显著性水平。学会了这种分析方法,就能够根据具体的检验问题选择检验统计量及构造否定域。
这种思想其实很朴素,生活当中有很多体现,比如某地区种植小麦,原来亩产量在500kg左右,改种新品种后,平均亩产量比500kg仅仅稍多一些,一般不会认为新品种产量会提高,如果新品种平均亩产达到600kg以上,比500kg明显的多,农民就会得出新品种产量高的结论。
从上面说明中,也能体会到显著性水平中“显著”二字的含义。
2 原假设及备择假设的设置
原假设和备选假设的设置问题,理论上的困惑是单边检验中等号一定放在原假设当中,实际操作中的困惑是如何正确设置原假设和备选假设。
(1)等号放在原假设里面,是精确控制第一类错误的需要。
关于两类错误的取舍思路教材上都有说明,就是控制第一类错误的前提下,尽量减少第二类错误。广泛使用的假设检验的评价标准N-P准则,大意就是犯第一类错误的概率不超过α的前提下,犯第二类错误的概率小者为优。
原假设不含等号的话,第一类错误无法控制。比如正态总体的单边假设检验,,假设已知,用Z检验,否定域为≥,第一类错误的概率
随μ的增大(不超过μ0)而增大,当μ=μ0时达到最大值α,第一类错误精确限制,否定域边界确定。如果原假设不含等号,否定域就不能精确界定。其他参数的单边检验也具有同样的性质。
(2)关于原假设和备择假设的设置思路,综合起来有以下几点:
一是,纯粹从方便记忆和做题的角度看,原假设含有等号,于是考虑问题时,先将提高、降低等不含等号的提法确定为备择假设,反过来确定原假设。
二是,从原理上理解假设检验方法具有保护原假设的特点,即没有特别明显的不利于原假设的证据,不拒绝原假设,实践上看,接受原假设比接受备择假设容易得多。因此将轻易不能得出的结论或者有可能产生严重后果的结论比如改进工艺后产品指标提高、药品副作用小的情景放在备择假设,或者体现一定的倾向性,故意将主观上不希望得出的一些判断放到备择假设。
三是,假设检验方法是用来解决对已有的认知是否改变以及改变方向进行定性的判断问题的,仅适用于对参数已经有比较充分了解的情况,若对参数一无所知的话一般不适合这种方法。设置原假设时,把历史状态、已有的认知放在原假设里边,抓住原假设的“原”字,既好理解也好记忆。
参考文献
[1]茆诗松.高等数理统计[M].北京:高等教育出版社,2004.
[2]陈希儒.数理统计学教程[M].合肥:中国科学技术大学出版社,2015.
[3]盛骤.概率论与数理统计[M].北京:高等教育出版社,2006.endprint