版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
區(qū)間估計和假設(shè)檢驗
趙耐青復(fù)旦大學(xué)衛(wèi)生統(tǒng)計教研室區(qū)間估計和假設(shè)檢驗趙耐青2內(nèi)容假設(shè)檢驗2可信區(qū)間與假設(shè)檢驗的關(guān)系3STATA命令4區(qū)間估計12內(nèi)容假設(shè)檢驗2可信區(qū)間與假設(shè)檢驗的關(guān)系3STATA命令4區(qū)3統(tǒng)計推斷點值估計參數(shù)估計區(qū)間估計統(tǒng)計推斷假設(shè)檢驗:均數(shù)間的比較比例、率的比較
……3統(tǒng)計推斷4點估計和區(qū)間估計參數(shù)估計可以分為點估計和區(qū)間估計點估計就是估計某個參數(shù)為某個數(shù)值(如樣本均數(shù),樣本率等)由于隨機抽樣存在抽樣誤差,由于點估計無法評價抽樣誤差的大小,而區(qū)間估計可以在95%可信度的尺度上估計參數(shù)的范圍,范圍越小,說明參數(shù)估計的抽樣誤差就越小。4點估計和區(qū)間估計參數(shù)估計可以分為點估計和區(qū)間估計5總體均數(shù)的區(qū)間估計假定資料近似服從正態(tài)分布。對于隨機抽樣而言,計算統(tǒng)計量因此基于隨機抽樣而言和成立的概率為0.95前提下總體均數(shù)的區(qū)間估計這個區(qū)間稱為總體均數(shù)的95%可信區(qū)間總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計5總體均數(shù)的區(qū)間估計假定資料6總體均數(shù)的95%可信區(qū)間舉例例如:在某地區(qū)7歲男孩的人群中隨機抽樣,抽取200人,測量其身高,得到樣本均數(shù)為121cm,樣本標(biāo)準(zhǔn)差為5.4cm,估計該地區(qū)7歲男孩人群的平均身高在什么范圍內(nèi)。6總體均數(shù)的95%可信區(qū)間舉例例如:在某地區(qū)7歲男孩的人群中7(1-)100%可信區(qū)間及其意義更一般而言,可以計算(1-)100%可信區(qū)間,稱(1-)為可信度??尚哦鹊囊饬x:在同一正態(tài)總體中隨機抽100個樣本,每個樣本可以計算一個95%可信區(qū)間,平均有95個可信區(qū)間包含該總體的總體均數(shù)。7(1-)100%可信區(qū)間及其意義更一般而言,可以計算(8(1-)100%可信區(qū)間及其意義可信度1-越大,計算可信區(qū)間包含總體均數(shù)的正確率就越高,但可信區(qū)間的寬度就越大,也就是估計總體均數(shù)的精度就越差。一般而言,95%可信區(qū)間是兼顧了正確性和估計精度,對于特殊情況,可以計算90%可信區(qū)間或99%可信區(qū)間。對于隨機抽樣前而言,隨機抽取一個樣本量為n的樣本,計算95%可信區(qū)間,則該區(qū)間將包含總體均數(shù)的概率為95%,不包含其總體均數(shù)的概率為0.05,這是一個小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,所以95%可信區(qū)間一般被認(rèn)為就是總體均數(shù)的范圍。8(1-)100%可信區(qū)間及其意義可信度1-越大,計算9假設(shè)檢驗(hypothesistesting)樣本均數(shù)與總體均數(shù)不等或兩樣本均數(shù)不等,有兩種可能:
由抽樣誤差所致兩者來自不同的總體
假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法9假設(shè)檢驗(hypothesistesting)樣本均數(shù)與10總體μ隨機抽樣不是抽樣誤差?即:0?樣本總體μ0=0?即:抽樣誤差?假設(shè)檢驗問題總體總體總體總體μ0總體不是抽樣誤差?即:0?總體μ0總體=0?即:抽樣誤差?不是抽樣誤差?即:0?總體μ0總體10總體隨機抽樣不是抽樣誤差?樣本總體=0?假設(shè)檢驗問題11總體22樣本2隨機抽樣樣本均數(shù)不等的原因統(tǒng)計推斷抽樣誤差即:1=2?樣本1假設(shè)檢驗問題總體11不是抽樣誤差即:12?11總體2樣本2隨樣本均數(shù)不等的原因抽樣誤差樣本1假設(shè)檢驗問12假設(shè)檢驗一般思想小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗中基本上不會發(fā)生。假設(shè)檢驗的反證法思想:先根據(jù)檢驗假設(shè)H0,建立適當(dāng)?shù)慕y(tǒng)計量,確定假設(shè)H0成立情況下服從某個概率分布,定一個范圍。H0成立時,統(tǒng)計量進(jìn)入這個范圍,是一個小概率事件(P0.05或更小),H0不成立時,統(tǒng)計量進(jìn)入這個范圍的概率較大。如果實際的抽樣樣本統(tǒng)計量進(jìn)入這個范圍,對H0成立情況下是一個小概率事件,一般不會發(fā)生,由此推斷假設(shè)H0不成立。這就是小概率反證法思想。12假設(shè)檢驗一般思想小概率思想是指小概率事件(P<0.01或13例如:拋硬幣,通常假設(shè):原假設(shè)H0:正反面出現(xiàn)的機會均等備擇假設(shè)H1:正反面出現(xiàn)機會不均等。如果拋20次只有1次是正面的,你就有理由懷疑原來假設(shè)“正反面出現(xiàn)的機會均等”是錯的(因為H0為真時出現(xiàn)這種情況的概率太小了,而H1為真時,出現(xiàn)這種情況的概率較大)。假設(shè)檢驗基本思想13例如:拋硬幣,通常假設(shè):假設(shè)檢驗基本思想14假設(shè)檢驗的基本步驟第一步:提出檢驗假設(shè)(又稱無效假設(shè)(原假設(shè))nullhypothesis,H0)和備擇假設(shè)(alternativehypothesis,H1)。預(yù)先設(shè)定的檢驗水準(zhǔn)(sizeoftest)α為0.05。選擇單雙側(cè)檢驗
H0:假設(shè)兩總體均數(shù)相等,即樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的。H1:假設(shè)兩總體均數(shù)不相等,即兩樣本與總體或樣本與樣本間存在本質(zhì)差異。14假設(shè)檢驗的基本步驟第一步:提出檢驗假設(shè)(又稱無效假設(shè)(原15第二步:選定統(tǒng)計方法,計算出統(tǒng)計量的大小。根據(jù)資料的類型和特點,可選用t檢驗,則計算t值或其他檢驗方法:秩和檢驗和卡方檢驗等。假設(shè)檢驗的基本步驟15第二步:選定統(tǒng)計方法,計算出統(tǒng)計量的大小。假設(shè)檢驗的基本16第三步:根據(jù)和統(tǒng)計量在原假設(shè)成立的分布情況把統(tǒng)計量可能的取值范圍分為拒絕范圍和不拒絕范圍根據(jù)統(tǒng)計量計算值位于拒絕范圍內(nèi)還是非拒絕范圍內(nèi)進(jìn)行統(tǒng)計推斷,也可以根據(jù)統(tǒng)計量取值的大小及其分布確定檢驗假設(shè)成立的可能性P的大小并判斷結(jié)果。假設(shè)檢驗的基本步驟p值指:在由H0所規(guī)定的總體中做隨機抽樣時,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計量的概率16第三步:根據(jù)和統(tǒng)計量在原假設(shè)成立的分布情況把統(tǒng)計量可能17t檢驗對資料的要求t檢驗的應(yīng)用條件:樣本來自正態(tài)總體兩樣本均數(shù)比較時還要求兩個總體方差相等17t檢驗對資料的要求18樣本均數(shù)與總體均數(shù)比較樣本均數(shù)與總體均數(shù)比較的t檢驗實際上是推斷該樣本來自的總體均數(shù)μ與已知的某一總體均數(shù)μ0(常為理論值或標(biāo)準(zhǔn)值)
有無差別。在未知總體中進(jìn)行抽樣,用樣本均數(shù)與已知總體均數(shù)比較中,需要建立一個檢驗統(tǒng)計量,根據(jù)樣本是否屬于已知總體,該檢驗統(tǒng)計量的分布也不同,由此作出相應(yīng)的統(tǒng)計推斷。18樣本均數(shù)與總體均數(shù)比較樣本均數(shù)與總體均數(shù)比較的t檢驗實際19樣本均數(shù)與總體均數(shù)比較舉例說明例:研究目的:山區(qū)健康男性的脈搏均數(shù)是否大于城市成年男性。根據(jù)大量調(diào)查,已知城市健康成年男性的脈搏均數(shù)為72次/分,某醫(yī)生在一山區(qū)隨即抽查了25名健康男性,求得其脈搏均數(shù)為76.2次/分,標(biāo)準(zhǔn)差為6.0次/分,問:是否能據(jù)此認(rèn)為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性?19樣本均數(shù)與總體均數(shù)比較舉例說明例:研究目的:山區(qū)健康男性20樣本均數(shù)與總體均數(shù)比較20樣本均數(shù)與總體均數(shù)比較21樣本均數(shù)與總體均數(shù)比較
上述樣本均數(shù)與總體均數(shù)不等既可能是抽樣誤差所致,也有可能真是環(huán)境差異的影響,做假設(shè)檢驗。因為σ未知,根據(jù)研究目的:山區(qū)健康男性的脈搏均數(shù)是否大于城市男性,可用t檢驗的單側(cè)檢驗,檢驗過程如下:
1.建立假設(shè)
H0:μ=μ0(本例μ0=72次/分),H1:μ≠μ02.設(shè)置檢驗水準(zhǔn)α為0.05。21樣本均數(shù)與總體均數(shù)比較上述樣本均數(shù)與總體均數(shù)不等既22檢驗統(tǒng)計量2.
設(shè)樣本所在總體為
樣本為
則
22檢驗統(tǒng)計量2.設(shè)樣本所在總體為檢驗統(tǒng)計量分布情況和假設(shè)檢驗基本思想23陰影面積為檢驗統(tǒng)計量超出界值的概率H0為真時,t檢驗統(tǒng)計量服從自由度為n-1的t分布,檢驗統(tǒng)計量|t|大于界值t/2的概率為H1為真時,t檢驗統(tǒng)計量|t|大于界值t/2的概率為1-(較大或很大)檢驗統(tǒng)計量分布情況和假設(shè)檢驗基本思想23陰影面積為檢驗統(tǒng)計量24樣本均數(shù)與總體均數(shù)比較2.
計算統(tǒng)計量進(jìn)行樣本均數(shù)與總體均數(shù)比較的t檢驗,計算t值
24樣本均數(shù)與總體均數(shù)比較2.計算統(tǒng)計量25樣本均數(shù)與總體均數(shù)比較3.確定臨界值,判斷是否應(yīng)該拒絕當(dāng)H0:μ=μ0=72次/分為真時,在大多數(shù)情況下,應(yīng)該在72附近,因此應(yīng)該在0附近隨機擺動。
當(dāng)H1:μ>μ0=72為真,在大多數(shù)情況下,應(yīng)該遠(yuǎn)離72,應(yīng)該比較大。注意:X的總體均數(shù)不一定為72,只有H0為真時,X的總體均數(shù)為72,
25樣本均數(shù)與總體均數(shù)比較3.確定臨界值,判斷是否應(yīng)該拒絕26樣本均數(shù)與總體均數(shù)比較可以證明:當(dāng)H0為真時,檢驗統(tǒng)計量服從自由度為24的t分布(即:df=24),查t分布表,臨界值t0.025=2.064,檢驗統(tǒng)計量t=3.5>2.064是小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,因此拒絕H0,并且可以認(rèn)為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性。26樣本均數(shù)與總體均數(shù)比較可以證明:當(dāng)H0為真時,檢驗27定義P值和應(yīng)用以下以單側(cè)檢驗為例:即:在H0為真的情況下,檢驗統(tǒng)計量大于樣本計算的統(tǒng)計量數(shù)值的概率。也就是P值=樣本統(tǒng)計量數(shù)值開始的尾部面積(示意見圖)。意義:如果t檢驗統(tǒng)計量樣本值t=t0.05,則P=t0.05尾部的面積,故P=0.05。P值=P(檢驗統(tǒng)計量>檢驗統(tǒng)計量樣本值|H0)27定義P值和應(yīng)用P值=P(檢驗統(tǒng)計量>檢驗統(tǒng)計量樣本值|H28定義P值和應(yīng)用如果檢驗統(tǒng)計量樣本值t>t0.05(u值比U0.05
更右側(cè)),則P=t尾部的面積<t0.05尾部的面積,則P<0.05。如果檢驗統(tǒng)計量樣本值t<t0.05(t值比t0.05
更左側(cè))
,則P=t尾部的面積>t0.05尾部的面積,則P>0.05。
綜合上述,P>檢驗統(tǒng)計量值<臨界值,不拒絕H0
。P<檢驗統(tǒng)計量值>臨界值,拒絕H0。28定義P值和應(yīng)用如果檢驗統(tǒng)計量樣本值t>t0.05(u值比29P值示意圖在實際研究中,只需計算P值并判斷是否P<決定是否拒絕H0。29P值示意圖在實際研究中,只需計算P值并判斷是否P<30假設(shè)檢驗的基本步驟若P值小于預(yù)先設(shè)定的檢驗水準(zhǔn)α,則H0成立的可能性小,即拒絕H0。若P值不小于預(yù)先設(shè)定的檢驗水準(zhǔn)α,則H0成立的可能性還不小,還不能拒絕H0。P值的大小一般可通過查閱相應(yīng)的界值表得到。30假設(shè)檢驗的基本步驟若P值小于預(yù)先設(shè)定的檢驗水準(zhǔn)α,則H31定義P值和應(yīng)用
確定概率P,作出判斷以自由度v=n-1查t界值表,0.025<P<0.05拒絕H0,接受H1,可認(rèn)為該山區(qū)成年健康男性的脈搏均數(shù)高于城市成年健康男性。
31定義P值和應(yīng)用確定概率P,作出判斷32單側(cè)t檢驗H0:=0
H1:>1
=0.05計算t檢驗統(tǒng)計量查t檢驗的單側(cè)界值,如果檢驗統(tǒng)計量則拒絕H0,反之不能拒絕H0。單側(cè)的P值=t分布中大于t的右側(cè)尾部面積32單側(cè)t檢驗H0:=0H1:33兩類錯誤33兩類錯誤34兩類錯誤示意圖34兩類錯誤示意圖35檢驗效能H1是真的,實際拒絕H0的概率=1-
稱為Power,又稱為檢驗效能35檢驗效能H1是真的,實際拒絕H0的概率=1-稱為P36進(jìn)行假設(shè)檢驗應(yīng)注意的問題做假設(shè)檢驗之前,應(yīng)注意資料本身是否有可比性。當(dāng)差別有統(tǒng)計學(xué)意義時應(yīng)注意這樣的差別在實際應(yīng)用中有無意義。根據(jù)資料類型和特點選用正確的假設(shè)檢驗方法。根據(jù)專業(yè)及經(jīng)驗確定是選用單側(cè)檢驗還是雙側(cè)檢驗。36進(jìn)行假設(shè)檢驗應(yīng)注意的問題做假設(shè)檢驗之前,應(yīng)注意資料本身是37進(jìn)行假設(shè)檢驗應(yīng)注意的問題當(dāng)檢驗結(jié)果為拒絕無效假設(shè)時,應(yīng)注意有發(fā)生I類錯誤的可能性,即錯誤地拒絕了本身成立的H0,發(fā)生這種錯誤的概率預(yù)先是知道的,即檢驗水準(zhǔn)那么大;當(dāng)檢驗結(jié)果為不拒絕無效假設(shè)時,應(yīng)注意有發(fā)生II類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發(fā)生這種錯誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯誤的大小有關(guān)系。當(dāng)?shù)谝活愬e誤增大時,第二類錯誤減小。37進(jìn)行假設(shè)檢驗應(yīng)注意的問題當(dāng)檢驗結(jié)果為拒絕無效假設(shè)時,應(yīng)注38進(jìn)行假設(shè)檢驗應(yīng)注意的問題判斷結(jié)論時不能絕對化,應(yīng)注意無論接受或拒絕檢驗假設(shè),都有判斷錯誤的可能性。
報告結(jié)論時是應(yīng)注意說明所用的統(tǒng)計量,檢驗的單雙側(cè)及P值的確切范圍。38進(jìn)行假設(shè)檢驗應(yīng)注意的問題判斷結(jié)論時不能絕對化,應(yīng)注意無論39進(jìn)行假設(shè)檢驗應(yīng)注意的問題t檢驗和u檢驗就是統(tǒng)計量為t,u的假設(shè)檢驗,兩者均是常見的假設(shè)檢驗方法。當(dāng)樣本含量n較大時,樣本均數(shù)符合正態(tài)分布,故可用u檢驗進(jìn)行分析。當(dāng)樣本含量n小時,若觀察值x符合正態(tài)分布,則用t檢驗(因此時樣本均數(shù)符合t分布)當(dāng)x為未知分布時應(yīng)采用秩和檢驗。39進(jìn)行假設(shè)檢驗應(yīng)注意的問題t檢驗和u檢驗就是統(tǒng)計量為t,u40可信區(qū)間與假設(shè)檢驗的關(guān)系不同:可信區(qū)間——量的問題假設(shè)檢驗——質(zhì)的問題可信區(qū)間亦可用于回答假設(shè)檢驗的問題可信區(qū)間比假設(shè)檢驗提供更多的信息可以回答有無統(tǒng)計學(xué)意義,還可回答有無實際意義40可信區(qū)間與假設(shè)檢驗的關(guān)系不同:可信區(qū)間——量的問題可信41可信區(qū)間與假設(shè)檢驗的關(guān)系41可信區(qū)間與假設(shè)檢驗的關(guān)系42STATA命令正態(tài)分布總體均數(shù)的95%可信區(qū)間命令為:cii樣本量樣本均數(shù)樣本標(biāo)準(zhǔn)差例4.1cii120.8960.05490%可信區(qū)間例4.2cii110121.724.74,level(90)level
括號中的數(shù)字表示可信度42STATA命令正態(tài)分布總體均數(shù)的95%可信區(qū)間ThankYou!ThankYou!區(qū)間估計和假設(shè)檢驗
趙耐青復(fù)旦大學(xué)衛(wèi)生統(tǒng)計教研室區(qū)間估計和假設(shè)檢驗趙耐青45內(nèi)容假設(shè)檢驗2可信區(qū)間與假設(shè)檢驗的關(guān)系3STATA命令4區(qū)間估計12內(nèi)容假設(shè)檢驗2可信區(qū)間與假設(shè)檢驗的關(guān)系3STATA命令4區(qū)46統(tǒng)計推斷點值估計參數(shù)估計區(qū)間估計統(tǒng)計推斷假設(shè)檢驗:均數(shù)間的比較比例、率的比較
……3統(tǒng)計推斷47點估計和區(qū)間估計參數(shù)估計可以分為點估計和區(qū)間估計點估計就是估計某個參數(shù)為某個數(shù)值(如樣本均數(shù),樣本率等)由于隨機抽樣存在抽樣誤差,由于點估計無法評價抽樣誤差的大小,而區(qū)間估計可以在95%可信度的尺度上估計參數(shù)的范圍,范圍越小,說明參數(shù)估計的抽樣誤差就越小。4點估計和區(qū)間估計參數(shù)估計可以分為點估計和區(qū)間估計48總體均數(shù)的區(qū)間估計假定資料近似服從正態(tài)分布。對于隨機抽樣而言,計算統(tǒng)計量因此基于隨機抽樣而言和成立的概率為0.95前提下總體均數(shù)的區(qū)間估計這個區(qū)間稱為總體均數(shù)的95%可信區(qū)間總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計5總體均數(shù)的區(qū)間估計假定資料49總體均數(shù)的95%可信區(qū)間舉例例如:在某地區(qū)7歲男孩的人群中隨機抽樣,抽取200人,測量其身高,得到樣本均數(shù)為121cm,樣本標(biāo)準(zhǔn)差為5.4cm,估計該地區(qū)7歲男孩人群的平均身高在什么范圍內(nèi)。6總體均數(shù)的95%可信區(qū)間舉例例如:在某地區(qū)7歲男孩的人群中50(1-)100%可信區(qū)間及其意義更一般而言,可以計算(1-)100%可信區(qū)間,稱(1-)為可信度??尚哦鹊囊饬x:在同一正態(tài)總體中隨機抽100個樣本,每個樣本可以計算一個95%可信區(qū)間,平均有95個可信區(qū)間包含該總體的總體均數(shù)。7(1-)100%可信區(qū)間及其意義更一般而言,可以計算(51(1-)100%可信區(qū)間及其意義可信度1-越大,計算可信區(qū)間包含總體均數(shù)的正確率就越高,但可信區(qū)間的寬度就越大,也就是估計總體均數(shù)的精度就越差。一般而言,95%可信區(qū)間是兼顧了正確性和估計精度,對于特殊情況,可以計算90%可信區(qū)間或99%可信區(qū)間。對于隨機抽樣前而言,隨機抽取一個樣本量為n的樣本,計算95%可信區(qū)間,則該區(qū)間將包含總體均數(shù)的概率為95%,不包含其總體均數(shù)的概率為0.05,這是一個小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,所以95%可信區(qū)間一般被認(rèn)為就是總體均數(shù)的范圍。8(1-)100%可信區(qū)間及其意義可信度1-越大,計算52假設(shè)檢驗(hypothesistesting)樣本均數(shù)與總體均數(shù)不等或兩樣本均數(shù)不等,有兩種可能:
由抽樣誤差所致兩者來自不同的總體
假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法9假設(shè)檢驗(hypothesistesting)樣本均數(shù)與53總體μ隨機抽樣不是抽樣誤差?即:0?樣本總體μ0=0?即:抽樣誤差?假設(shè)檢驗問題總體總體總體總體μ0總體不是抽樣誤差?即:0?總體μ0總體=0?即:抽樣誤差?不是抽樣誤差?即:0?總體μ0總體10總體隨機抽樣不是抽樣誤差?樣本總體=0?假設(shè)檢驗問題54總體22樣本2隨機抽樣樣本均數(shù)不等的原因統(tǒng)計推斷抽樣誤差即:1=2?樣本1假設(shè)檢驗問題總體11不是抽樣誤差即:12?11總體2樣本2隨樣本均數(shù)不等的原因抽樣誤差樣本1假設(shè)檢驗問55假設(shè)檢驗一般思想小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗中基本上不會發(fā)生。假設(shè)檢驗的反證法思想:先根據(jù)檢驗假設(shè)H0,建立適當(dāng)?shù)慕y(tǒng)計量,確定假設(shè)H0成立情況下服從某個概率分布,定一個范圍。H0成立時,統(tǒng)計量進(jìn)入這個范圍,是一個小概率事件(P0.05或更小),H0不成立時,統(tǒng)計量進(jìn)入這個范圍的概率較大。如果實際的抽樣樣本統(tǒng)計量進(jìn)入這個范圍,對H0成立情況下是一個小概率事件,一般不會發(fā)生,由此推斷假設(shè)H0不成立。這就是小概率反證法思想。12假設(shè)檢驗一般思想小概率思想是指小概率事件(P<0.01或56例如:拋硬幣,通常假設(shè):原假設(shè)H0:正反面出現(xiàn)的機會均等備擇假設(shè)H1:正反面出現(xiàn)機會不均等。如果拋20次只有1次是正面的,你就有理由懷疑原來假設(shè)“正反面出現(xiàn)的機會均等”是錯的(因為H0為真時出現(xiàn)這種情況的概率太小了,而H1為真時,出現(xiàn)這種情況的概率較大)。假設(shè)檢驗基本思想13例如:拋硬幣,通常假設(shè):假設(shè)檢驗基本思想57假設(shè)檢驗的基本步驟第一步:提出檢驗假設(shè)(又稱無效假設(shè)(原假設(shè))nullhypothesis,H0)和備擇假設(shè)(alternativehypothesis,H1)。預(yù)先設(shè)定的檢驗水準(zhǔn)(sizeoftest)α為0.05。選擇單雙側(cè)檢驗
H0:假設(shè)兩總體均數(shù)相等,即樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的。H1:假設(shè)兩總體均數(shù)不相等,即兩樣本與總體或樣本與樣本間存在本質(zhì)差異。14假設(shè)檢驗的基本步驟第一步:提出檢驗假設(shè)(又稱無效假設(shè)(原58第二步:選定統(tǒng)計方法,計算出統(tǒng)計量的大小。根據(jù)資料的類型和特點,可選用t檢驗,則計算t值或其他檢驗方法:秩和檢驗和卡方檢驗等。假設(shè)檢驗的基本步驟15第二步:選定統(tǒng)計方法,計算出統(tǒng)計量的大小。假設(shè)檢驗的基本59第三步:根據(jù)和統(tǒng)計量在原假設(shè)成立的分布情況把統(tǒng)計量可能的取值范圍分為拒絕范圍和不拒絕范圍根據(jù)統(tǒng)計量計算值位于拒絕范圍內(nèi)還是非拒絕范圍內(nèi)進(jìn)行統(tǒng)計推斷,也可以根據(jù)統(tǒng)計量取值的大小及其分布確定檢驗假設(shè)成立的可能性P的大小并判斷結(jié)果。假設(shè)檢驗的基本步驟p值指:在由H0所規(guī)定的總體中做隨機抽樣時,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計量的概率16第三步:根據(jù)和統(tǒng)計量在原假設(shè)成立的分布情況把統(tǒng)計量可能60t檢驗對資料的要求t檢驗的應(yīng)用條件:樣本來自正態(tài)總體兩樣本均數(shù)比較時還要求兩個總體方差相等17t檢驗對資料的要求61樣本均數(shù)與總體均數(shù)比較樣本均數(shù)與總體均數(shù)比較的t檢驗實際上是推斷該樣本來自的總體均數(shù)μ與已知的某一總體均數(shù)μ0(常為理論值或標(biāo)準(zhǔn)值)
有無差別。在未知總體中進(jìn)行抽樣,用樣本均數(shù)與已知總體均數(shù)比較中,需要建立一個檢驗統(tǒng)計量,根據(jù)樣本是否屬于已知總體,該檢驗統(tǒng)計量的分布也不同,由此作出相應(yīng)的統(tǒng)計推斷。18樣本均數(shù)與總體均數(shù)比較樣本均數(shù)與總體均數(shù)比較的t檢驗實際62樣本均數(shù)與總體均數(shù)比較舉例說明例:研究目的:山區(qū)健康男性的脈搏均數(shù)是否大于城市成年男性。根據(jù)大量調(diào)查,已知城市健康成年男性的脈搏均數(shù)為72次/分,某醫(yī)生在一山區(qū)隨即抽查了25名健康男性,求得其脈搏均數(shù)為76.2次/分,標(biāo)準(zhǔn)差為6.0次/分,問:是否能據(jù)此認(rèn)為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性?19樣本均數(shù)與總體均數(shù)比較舉例說明例:研究目的:山區(qū)健康男性63樣本均數(shù)與總體均數(shù)比較20樣本均數(shù)與總體均數(shù)比較64樣本均數(shù)與總體均數(shù)比較
上述樣本均數(shù)與總體均數(shù)不等既可能是抽樣誤差所致,也有可能真是環(huán)境差異的影響,做假設(shè)檢驗。因為σ未知,根據(jù)研究目的:山區(qū)健康男性的脈搏均數(shù)是否大于城市男性,可用t檢驗的單側(cè)檢驗,檢驗過程如下:
1.建立假設(shè)
H0:μ=μ0(本例μ0=72次/分),H1:μ≠μ02.設(shè)置檢驗水準(zhǔn)α為0.05。21樣本均數(shù)與總體均數(shù)比較上述樣本均數(shù)與總體均數(shù)不等既65檢驗統(tǒng)計量2.
設(shè)樣本所在總體為
樣本為
則
22檢驗統(tǒng)計量2.設(shè)樣本所在總體為檢驗統(tǒng)計量分布情況和假設(shè)檢驗基本思想66陰影面積為檢驗統(tǒng)計量超出界值的概率H0為真時,t檢驗統(tǒng)計量服從自由度為n-1的t分布,檢驗統(tǒng)計量|t|大于界值t/2的概率為H1為真時,t檢驗統(tǒng)計量|t|大于界值t/2的概率為1-(較大或很大)檢驗統(tǒng)計量分布情況和假設(shè)檢驗基本思想23陰影面積為檢驗統(tǒng)計量67樣本均數(shù)與總體均數(shù)比較2.
計算統(tǒng)計量進(jìn)行樣本均數(shù)與總體均數(shù)比較的t檢驗,計算t值
24樣本均數(shù)與總體均數(shù)比較2.計算統(tǒng)計量68樣本均數(shù)與總體均數(shù)比較3.確定臨界值,判斷是否應(yīng)該拒絕當(dāng)H0:μ=μ0=72次/分為真時,在大多數(shù)情況下,應(yīng)該在72附近,因此應(yīng)該在0附近隨機擺動。
當(dāng)H1:μ>μ0=72為真,在大多數(shù)情況下,應(yīng)該遠(yuǎn)離72,應(yīng)該比較大。注意:X的總體均數(shù)不一定為72,只有H0為真時,X的總體均數(shù)為72,
25樣本均數(shù)與總體均數(shù)比較3.確定臨界值,判斷是否應(yīng)該拒絕69樣本均數(shù)與總體均數(shù)比較可以證明:當(dāng)H0為真時,檢驗統(tǒng)計量服從自由度為24的t分布(即:df=24),查t分布表,臨界值t0.025=2.064,檢驗統(tǒng)計量t=3.5>2.064是小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,因此拒絕H0,并且可以認(rèn)為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性。26樣本均數(shù)與總體均數(shù)比較可以證明:當(dāng)H0為真時,檢驗70定義P值和應(yīng)用以下以單側(cè)檢驗為例:即:在H0為真的情況下,檢驗統(tǒng)計量大于樣本計算的統(tǒng)計量數(shù)值的概率。也就是P值=樣本統(tǒng)計量數(shù)值開始的尾部面積(示意見圖)。意義:如果t檢驗統(tǒng)計量樣本值t=t0.05,則P=t0.05尾部的面積,故P=0.05。P值=P(檢驗統(tǒng)計量>檢驗統(tǒng)計量樣本值|H0)27定義P值和應(yīng)用P值=P(檢驗統(tǒng)計量>檢驗統(tǒng)計量樣本值|H71定義P值和應(yīng)用如果檢驗統(tǒng)計量樣本值t>t0.05(u值比U0.05
更右側(cè)),則P=t尾部的面積<t0.05尾部的面積,則P<0.05。如果檢驗統(tǒng)計量樣本值t<t0.05(t值比t0.05
更左側(cè))
,則P=t尾部的面積>t0.05尾部的面積,則P>0.05。
綜合上述,P>檢驗統(tǒng)計量值<臨界值,不拒絕H0
。P<檢驗統(tǒng)計量值>臨界值,拒絕H0。28定義P值和應(yīng)用如果檢驗統(tǒng)計量樣本值t>t0.05(u值比72P值示意圖在實際研究中,只需計算P值并判斷是否P<決定是否拒絕H0。29P值示意圖在實際研究中,只需計算P值并判斷是否P<73假設(shè)檢驗的基本步驟若P值小于預(yù)先設(shè)定的檢驗水準(zhǔn)α,則H0成立的可能性小,即拒絕H0。若P值不小于預(yù)先設(shè)定的檢驗水準(zhǔn)α,則H0成立的可能性還不小,還不能拒絕H0。P值的大小一般可通過查閱相應(yīng)的界值表得到。30假設(shè)檢驗的基本步驟若P值小于預(yù)先設(shè)定的檢驗水準(zhǔn)α,則H74定義P值和應(yīng)用
確定概率P,作出判斷以自由度v=n-1查t界值表,0.025<P<0.05拒絕H0,接受H1,可認(rèn)為該山區(qū)成年健康男性的脈搏均數(shù)高于城市成年健康男性。
31定義P值和應(yīng)用確定概率P,作出判斷75單側(cè)t
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年財務(wù)管理(成本核算)試題及答案
- 2025年大學(xué)第一學(xué)年(歷史學(xué))中國古代史先秦時期試題及答案
- 2025年中職(會計電算化專業(yè))賬務(wù)初始化試題及答案
- 2025年大學(xué)大二(市場營銷)促銷組合策略階段測試試題及答案
- 2025年大學(xué)動物學(xué)(動物生理機能)試題及答案
- 2025年中職汽車(汽車維修基礎(chǔ))試題及答案
- 2025年高職(汽車檢測與維修技術(shù))汽車故障排除實訓(xùn)試題及答案
- 2025年中職建筑(建筑結(jié)構(gòu)基礎(chǔ))試題及答案
- 2025年大學(xué)水產(chǎn)養(yǎng)殖學(xué)(病害防控研究)試題及答案
- 2025年大學(xué)大四(物流工程)物流工程技術(shù)應(yīng)用創(chuàng)新階段測試題及答案
- 湖南省2025-2026學(xué)年七年級歷史上學(xué)期期末復(fù)習(xí)試卷(含答案)
- 2026年中國熱帶農(nóng)業(yè)科學(xué)院南亞熱帶作物研究所第一批招聘23人備考題庫完美版
- 2026新疆阿合奇縣公益性崗位(鄉(xiāng)村振興專干)招聘44人考試參考試題及答案解析
- 紡織倉庫消防安全培訓(xùn)
- 器官移植術(shù)后排斥反應(yīng)的風(fēng)險分層管理
- 虛擬電廠關(guān)鍵技術(shù)
- 事業(yè)單位清算及財務(wù)報告編寫范本
- 護(hù)坡綠化勞務(wù)合同范本
- 臨床績效的DRG與CMI雙指標(biāo)調(diào)控
- 護(hù)坡施工安全專項方案
- 光伏電源項目工程建設(shè)管理資料表格格式匯編
評論
0/150
提交評論