推断性统计有四个理论部分:概率理论和假设检验理论
![](http://www.onekao.net/templets/default/images/content_ad.gif)
推测性统计有四个理论部份:机率理论,抽样理论、估计理论和假定检测理论。机率理论和抽样理论是推测性统计的基础,而恐怕理论和假定检测理论是推测性统计的应用。 #
恐怕与假定检测的优劣
#
不同点:恐怕和假定检测都用样本信息对总体特性进行统计推论,但推测的方式完全不同。
#
对于未知的总体参数两样本均数比较的t检验,恐怕理论是将样本信息拿来恐怕总体参数的值,并应用一个已知(设定)的置信水平来使该值落在某个区间内,比如:总体均值95%的置信区间是[a,b]。
假定检测理论是设定两个对立的假定,样本信息适于决策,决定那个假定可接受,因而觉得该假定是可信的,比如:零假定:总体均值等于5;对立假定:总体均值不等于5;通过样本信息,决定是否接受总体均值等于5这个假定,这对假定可以拿来侦测总体均值是否由于某些改进有变化。
#
相似点:恐怕和假定检测的基础都是抽样分布,由于运用这种抽样分布的分布特点和统计量,能够推导入恐怕和假定检测的机率公式。 #
比如:总体均值的目测和假定检测用到均值的抽样分布:正态分布或对其进行标准正态变换后的标准正态分布(Z统计量);假如总体残差未知,均值的目测和假定检测用到的抽样分布是t分布(T统计量);总体残差的目测和假定检测用到卡方分布(卡方统计量)。
#
原假定和备择假定
#
在参数检测中,首先要对某一总体参数构建一个假定,并在此后的抽样推论中以这一假定为前提进行检测。这一假定被称为原假定,用H0表示。 #
原假定与备择假定是一种对立关系。假如检测的结果抵制了原假定,就应当接收另一假定——备择假定,用H1表示。 #
推行参数假定之后,检测的结果或则是原假定创立,或则是备择假定创立,二者必选其二。 #
实例:灯泡厂家在给用户提供一批灯泡时宣称两样本均数比较的t检验,该批灯泡的平均使用寿命是1600小时。为了验证厂家的说法,还要用样本数据进行检测。因而用户首先要做出如下假定
H0:?=1600;
#
随即用户要选用样本并估算样本的数据。假如样本数据很接近1600小时,则可接收原假定;假如样本数据离1600小时很远(远远低于或高于1600小时),都会抵制原假定,同时就该接收备择假定。 #
H1:?≠1600。
通常在假定检测时,我们会将两个假定并列写在检测之前,即 #
H0:?=1600;H1:?≠1600。
#
接受域和抵制域 #
假定设定之后,还要设定一个判断标准,用以分辨样本数据为多少时才可以接受原假定或则抵制原假定。这个判断标准就是给定一个小机率,按照“小机率风波原理”作出判定(小机率风波会发生),这儿小机率用α表示,称为明显性水平。
#
比如,假定H0:?=1600;H1:?≠1600,在假定之后给定一个小机率α=0.05,那样就可以在假定创立的分布中,确定两个区域:一个是接近?=1600的区域,称之为接受域;另一个是避开?=1600的区域,称之为抵制域。
接受域和抵制域按照单侧检测或两侧检测,分布方式不同。
#
对假定进行判断时,无论是单侧检测还是左侧检测,都适宜以下的判断原则: #
1、样本数值落在接受域内,则接受原假定,同时婉拒备择假定;
#
2、样本数值落在抵制域内,则抵制原假定,同时接受备择假定。
假定检测的两类错误 #
理想的假定检测是当H0是正确的假定时,才能判断为接受。当H0是不正确的假定时,才能判断为抵制。虽然,在由样本统计量数据断定总体参数时,因为样本数据具备随机性,所以在判断时,就或许有四种结果出现: #
H0为真但判断为抵制,这些错误为“弃真”错误,正式真的当作假的,亦即为第一类错误。
H0为真并被接受,这是正确的判断。 #
H0为假并被抵制,这是正确的判断。
#
H0为假并被接受,这种错误称为“取伪”错误,将要假的当作真的,亦即为第二类错误。
当检测结果接受原假定H0时,判断或许是正确的,还有或许犯“取伪”错误。一般用β表示犯“取伪”错误的机率,β的机率是由真正的总体参数的分布所决定的。在假定检测中,因为真实总体参数值不可知,所以,β的机率值也不可知。 #
因此在检测中,假如推论是抵制H0,接受H1,这么犯错误的机率很小(α)。并且假如推论是接受H0,抵制H1,则犯错误的机率(β)是不可知。从这一点来看,何谓接受H0,实质是不能抵制H0,即在没有足够证据证明状况下只好接受。
但是β在检测时是未知的,但对于一个固定的总体来说,当给定α之后,β的数值也就逐渐确定,如右图: