版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
假設(shè)檢驗一、假設(shè)檢驗的基本思想
例7.2某醫(yī)生研究一種新的治療充血性心力衰竭的方法,對50位心功能在2~3級之間的成年男性患者進(jìn)行4周的治療,考察其療效。評價療效的一個指標(biāo)是鍛煉持續(xù)時間的增加量(min)。以前常規(guī)的治療方法能使患者的鍛煉持續(xù)時間平均增加3min。該醫(yī)生通過50位接受新方法治療的患者的數(shù)據(jù)算得鍛煉持續(xù)時間平均增加4min,標(biāo)準(zhǔn)差為1.5min。該新療法使患者鍛煉持續(xù)時間的平均增加量是否多于常規(guī)療法的3min?(u≠?)=3min常規(guī)方法:新方法:n=50=4min
S=1.5minu=?問題:
樣本均數(shù)與已知總體均數(shù)不等,可能
①由于抽樣誤差所致(u
=
兩總體均數(shù)相等)
②由于兩種治療方案導(dǎo)致差異(u≠)=3minun=50=4min
S=1.5min如何確定具體的原因,需通過分析樣本數(shù)據(jù),從兩種假設(shè)中作抉擇。一種假設(shè)是“新療法使患者鍛煉持續(xù)時間的平均增加量等于常規(guī)療法的3min”,稱之為零假設(shè)(nullhypothesis),也稱無效假設(shè)或無差異假設(shè),記為H0
,表示目前的差異是由抽樣誤差引起的;另一種假設(shè)是“新療法使患者鍛煉持續(xù)時間的平均增加量不等于常規(guī)療法的3min”,稱之為備擇假設(shè)(alternativehypothesis)或?qū)α⒓僭O(shè),記為H1
,表示兩者的療效存在本質(zhì)不同。假設(shè)新療法和常規(guī)療法的療效相同,那么由于偶然性得到樣本均數(shù)等于及大于4min的可能性有多大?如果能算出這個可能性(即概率值)的大小,就可以下結(jié)論了。同樣如果某事件發(fā)生的可能性≤
5%,就認(rèn)為是小概率事件,在一次試驗中幾乎不會發(fā)生。
如果算出的概率P值≤5%,就可以拒絕H0,認(rèn)為與的差別是不是偶然性造成的,新療法和常規(guī)療法在延長鍛煉持續(xù)時間上存在差異。
如果算出的概率P值>5%,就不能拒絕H0,認(rèn)為與的差別是偶然性造成的,新療法和常規(guī)療法在延長鍛煉持續(xù)時間上不存在差異。
確定P值的大小是假設(shè)檢驗的關(guān)鍵。
假設(shè)成立,則可將用公式P值指零假設(shè)成立的條件下,出現(xiàn)等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計量的概率。
查t界值表,自由度v近似取50,可得到P
<0.001
。說明在零假設(shè)成立的前提下,出現(xiàn)樣本均數(shù)等于及大于4min可能性很小(P
<0.001)。這是一個小概率事件,我們認(rèn)為在一次試驗中幾乎不會發(fā)生,但現(xiàn)在發(fā)生了,只有懷疑原假設(shè)不成立。
假設(shè)檢驗的目的是推斷樣本統(tǒng)計量之差是由于總體參數(shù)存在差異造成的,抑或由于抽樣誤差造成的。
假設(shè)檢驗的基本思想是在總體參數(shù)相等這一假設(shè)成立的前提下,計算出現(xiàn)等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計量的可能性(P值)。如果P值很小,小于等于事先規(guī)定的一個界值(例如5%),結(jié)論就是拒絕假設(shè)“總體參數(shù)相等”,認(rèn)為總體參數(shù)之間存在差異。如果P值大于事先規(guī)定的界值,就不能拒絕這個假設(shè),尚不能認(rèn)為總體參數(shù)之間存在差異。二、假設(shè)檢驗的基本步驟1、建立檢驗假設(shè),確立檢驗水準(zhǔn)。
①檢驗假設(shè)(hypothesisundertest/tobetested)
無效假設(shè)(nullhypothesis):②備擇假設(shè)(alternativehypothesis)
對立假設(shè):*檢驗假設(shè)是針對總體而非樣本;
*H0和H1是相互聯(lián)系、對立的假設(shè),兩者缺一不可
*H0為無效假設(shè),其假定通常是:某兩個(或多個)總體參數(shù)相等,或某兩個總體參數(shù)之差等于0
*H1的內(nèi)容反映了檢驗的單雙側(cè)。若H1假設(shè)為
0或
<
0,則為單側(cè)檢驗(one-sidedtest)。若H1為
0,則為雙側(cè)檢驗(two-sidedtest)。單雙側(cè)檢驗應(yīng)根據(jù)專業(yè)知識事先確定。③檢驗水準(zhǔn)(sizeofatest),又稱
水準(zhǔn):過去稱顯著性水準(zhǔn)(significancelevel)。是預(yù)先規(guī)定的概率值,它確定了小概率事件的標(biāo)準(zhǔn)。
為I型錯誤的概率大小。實際工作中常取
=0.05。注意:H0和
H1
和
的確定,以及單、雙側(cè)的選擇,都應(yīng)結(jié)合研究設(shè)計,在未獲得樣本結(jié)果之前決定。2、選擇檢驗方法、計算檢驗統(tǒng)計量
根據(jù)分析目的、資料類型、設(shè)計類型、樣本大小、方法的適用條件等選擇相應(yīng)的檢驗方法并計算檢驗統(tǒng)計量。所有檢驗統(tǒng)計量都是在假設(shè)H0
成立的條件下計算出來的,它是用于決定是否拒絕H0
的統(tǒng)計量,其統(tǒng)計分布在統(tǒng)計推斷中至關(guān)重要。3、確定P值和作出推斷結(jié)論
根據(jù)算出的檢驗統(tǒng)計量如t、Z值,查相應(yīng)的界值表,即可得到概率P。
P是指從H0規(guī)定的總體作隨機(jī)抽樣,抽得等于及大于現(xiàn)有樣本獲得的檢驗統(tǒng)計量值的概率。推斷結(jié)論應(yīng)包括統(tǒng)計結(jié)論與專業(yè)結(jié)論兩部分:
P≤α
,按α
水準(zhǔn),拒絕H0,接受H1,有統(tǒng)計學(xué)意義(統(tǒng)計結(jié)論),可認(rèn)為……不同或不等(專業(yè)結(jié)論)
。
P>α
,按α
水準(zhǔn),不拒絕H0,無統(tǒng)計學(xué)意義,尚不能認(rèn)為……不同或不等。統(tǒng)計結(jié)論只說明有統(tǒng)計學(xué)意義或無統(tǒng)計學(xué)意義,而不能說明專業(yè)上的差異大小。應(yīng)注意統(tǒng)計學(xué)意義與專業(yè)意義的區(qū)別。
當(dāng)P≤α,結(jié)論為按所規(guī)定α檢驗水準(zhǔn),拒絕H0
,接受H1
。因為現(xiàn)有樣本信息不支持H0
成立,故拒絕H0。顯然,拒絕H0,不能認(rèn)為H0肯定不成立。Ⅰ型錯誤。相反,如P>α,即樣本信息支持H0成立,故不拒絕H0
。同樣,不拒絕H0
,也不能認(rèn)為H0肯定成立。Ⅱ錯誤。假設(shè)檢驗必須對所檢驗的假設(shè)作出明確判斷。從“拒絕”或“不拒絕”中選擇一個較為合理的決定,因此,假設(shè)檢驗結(jié)論具有概率性。不論拒絕或不拒絕H0,都可能犯錯誤:Ⅰ型或Ⅱ型錯誤。三、Ⅰ型錯誤與Ⅱ型錯誤。I型錯誤
拒絕了實際上正確的H0,這類“棄真”的錯誤稱為I型錯誤,其概率大小為
。如規(guī)定
=0.05,當(dāng)拒絕H0時,則理論上100次檢驗中平均有5次發(fā)生這樣的錯誤。
II型錯誤
不拒絕實際上不成立的H0,這類“存?zhèn)巍钡腻e誤稱為II型錯誤,其概率大小用
表示,其大小未知t
(界值)H0H1αβ圖7.1兩型錯誤示意圖(以單側(cè)t檢驗為例)
假設(shè)檢驗的結(jié)論拒絕不拒絕(“接受”)正確I型錯誤(α
)推斷正確(1-α
)不正確推斷正確(1-β
)II型錯誤(β
)真實情況I型錯誤和II型錯誤
1
稱為檢驗效能(powerofatest)。其意義是當(dāng)兩總體參數(shù)確實存在差異即H1:
0成立,使用假設(shè)檢驗方法能夠發(fā)現(xiàn)差異(即拒絕H0)的能力。
如1
=0.90,意味著若兩總體確有差別,則理論上在100次檢驗中,平均有90次能夠得出有統(tǒng)計學(xué)意義的結(jié)論。
拒絕H0,只可能犯I型錯誤,不可能犯II型錯誤;不拒絕H0,只可能犯II型錯誤,不可能犯I型錯誤。
愈小,
愈大;反之
愈大,
愈小。若要同時減小I型錯誤
以及II型錯誤
,則只有增加樣本含量n。
五、假設(shè)檢驗的注意事項嚴(yán)密的研究設(shè)計這是假設(shè)檢驗的前提。包括隨機(jī)抽樣和組間的可比性等。
2.數(shù)據(jù)應(yīng)該滿足假設(shè)檢驗方法的前提條件
應(yīng)根據(jù)分析目的、資料類型、設(shè)計方案、資料的分布、樣本含量的大小以及方法的適用條件等選擇適宜的統(tǒng)計檢驗方法。3.正確理解假設(shè)檢驗中概率P的含義
P值是指在成立的前提下,出現(xiàn)現(xiàn)有樣本統(tǒng)計量以及更極端情況的概率。P值越小說明當(dāng)前樣本的證據(jù)越傾向于拒絕H0,當(dāng)P值小于等于事先規(guī)定的檢驗水準(zhǔn)時,就拒絕H0。
P值的大小不僅與總體參數(shù)間的差別有關(guān),而且與抽樣誤差等有關(guān)。不能認(rèn)為P值越小,總體參數(shù)間的差別越大。P值越小,說明實際觀測到的差異與之間不一致的程度就越大,越有理由拒絕。假設(shè)檢驗只做出拒絕或不拒絕的定性結(jié)論,但不能給出總體參數(shù)間差別大小的結(jié)論。4.結(jié)論不能絕對化
報告結(jié)果時應(yīng)注意措辭,應(yīng)列出檢驗水準(zhǔn)、檢驗統(tǒng)計量值,P值的確切范圍、統(tǒng)計結(jié)論和專業(yè)結(jié)論。5.正確理解“顯著性”、“統(tǒng)計學(xué)意義”與“專業(yè)意義”
1)差別具有“顯著性”指差別具有“統(tǒng)計學(xué)意義”;
2)具有“統(tǒng)計學(xué)意義”不一定具有“專業(yè)意義”
六、假設(shè)檢驗與區(qū)間估計的聯(lián)系
假設(shè)檢驗用于推斷總體參數(shù)是否不相等。兩者既有區(qū)別,又有聯(lián)系。
就同一份資料,如例7.3,若假設(shè)檢驗的結(jié)果是,拒絕H0,接受H1,則其(1-
)的置信區(qū)間必定不包括所規(guī)定的總體參數(shù),反之亦然。置信區(qū)間能夠給出總體參數(shù)的可能范圍,而假設(shè)檢驗?zāi)軌蚪o出一個確切的概率P值。圖7.2置信區(qū)間提供的信息
置信區(qū)間與假設(shè)檢驗的作用是相輔的,若兩者結(jié)合起來,可以提供更為全面的統(tǒng)計推斷信息。因此學(xué)術(shù)期刊建議論文在報告假設(shè)檢驗結(jié)論的同時,應(yīng)該報告相應(yīng)的區(qū)間估計的結(jié)果。
t檢驗
假設(shè)檢驗一般以檢驗統(tǒng)計量命名,如t檢驗應(yīng)用時應(yīng)了解各種檢驗方法的應(yīng)用條件和檢驗統(tǒng)計量的計算方法。然后按假設(shè)檢驗的一般步驟來處理實際問題。
t檢驗的應(yīng)用條件:①樣本取自正態(tài)總體;②σ未知且n較小–單樣本t檢驗;③兩小樣本均數(shù)比較時,兩樣本的總體方差相等;若兩總體方差不齊可用t’檢驗;④兩大樣本均數(shù)比較時,可用Z檢驗。
1、樣本均數(shù)與總體均數(shù)比較的t檢驗
樣本均數(shù)與已知總體均數(shù)(理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值)比較,其目的是推斷樣本所代表的未知總體均數(shù)u與已知總體均數(shù)有無差別。若n較大,則,可按算得的t值用v=∞查t界值表(t即為Z)得P值。v=n-1
例8.1
(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)
H0:
=3.36,該地農(nóng)村新生兒體重與該地新生兒平均體重相同
H1:
3.36,該地農(nóng)村新生兒體重與該地新生兒平均體重不同
=0.05(2)計算統(tǒng)計量
已知n=40,=3.27kg,S=0.44kg,=3.36kg。按式(8.1)=n–1=40–1=39(3)確定P值,作出統(tǒng)計推斷
查附表3,t界值表,t=-1.294的絕對值,得0.2<P<0.4,按=0.05檢驗水準(zhǔn),不拒絕H0,差異無統(tǒng)計學(xué)意義,尚不能認(rèn)為該地農(nóng)村新生兒體重與該地新生兒平均體重相同。2、配對設(shè)計均數(shù)比較的t
檢驗(配對t
檢驗)配對設(shè)計:①配對的兩個受試對象分別接受兩種處理②同一樣品用兩種方法或儀器檢測的結(jié)果③同一受試對象兩個部位的檢測結(jié)果配對t
檢驗?zāi)康氖峭茢鄡煞N處理或方法的結(jié)果有無差別
首先求出各對差值,再求出差值的均數(shù)。若兩種處理效應(yīng)相同,差值的總體均數(shù)應(yīng)為0,因此配對設(shè)計的均數(shù)比較可看成是差值的樣本均數(shù)與總體均數(shù)0的比較。見例8.2該資料為配對設(shè)計,所以可以用配對t檢驗作統(tǒng)
計推斷,具體步驟如下:(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)H0:兩種方法檢驗結(jié)果相同,即
d=0
H1:兩種方法檢驗結(jié)果不同,即
d
0
=0.05(2)計算統(tǒng)計量
差值的標(biāo)準(zhǔn)差為
=3.250按公式
=n–1=12–1=11(3)確定P值,作出統(tǒng)計推斷
查附表2,t界值表,得P<0.001,按
=0.05水準(zhǔn)拒絕H0,差異有統(tǒng)計學(xué)意義,可以認(rèn)為兩種方法檢查的結(jié)果不同。3、兩樣本均數(shù)比較的t檢驗
為兩樣本均數(shù)差值的標(biāo)準(zhǔn)誤
在兩總體方差相等的條件下,可將兩方差合并,求合并方差(pooledvariance)例8.3組別例數(shù)均數(shù)標(biāo)準(zhǔn)差銀屑病患者12182.427.7正常人12149.719.5表8.2銀屑病組與正常對照組的血清IL-6(pg/ml)(1)建立假設(shè)檢驗,確定檢驗水準(zhǔn)
H0:
1=
2,銀屑病患者與正常人血清IL-6均數(shù)相等,
H1:
1
2,銀屑病患者與正常人血清IL-6均數(shù)不相等,
=0.05(2)計算統(tǒng)計量
今n1=12,=182.4pg/mL,S1=27.7pg/mL,n2=12,=149.7pg/mL,S2=19.5pg/mL按式(8.4)得=n1+n2–2=12+12–2=22
(3)確定P值,作出統(tǒng)計推斷
查附表3,t界值表,得0.002<P<0.005,按
=0.05水準(zhǔn)拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義,故可認(rèn)為銀屑病患者與正常人血清IL-6均數(shù)不同,銀屑病患者的血清IL-6較高。
當(dāng)兩樣本均大于50,即使總體分布偏離正態(tài),其樣本均數(shù)仍近似正態(tài)分布,可用Z檢驗。本資料是成組設(shè)計的兩樣本均數(shù)比較,可用t檢驗,
由于兩樣本含量皆較大,也可用Z檢驗以簡化算。
(1)建立假設(shè)檢驗,確定檢驗水準(zhǔn)H0:該市高碘區(qū)與非高碘區(qū)兒童智力均數(shù)相等,即
1=2
H1:該市高碘區(qū)與非高碘區(qū)兒童智力均數(shù)不等,即
1
2=0.05(2)計算統(tǒng)計量
今=73.07,
S1=10.75,n1=100=80.30,S2=11.83,n2=105(3)確定P值,作出統(tǒng)計推斷
查附表2,t界值表(
=
時),得P<0.001,按
=0.05水準(zhǔn)拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義,可認(rèn)為該農(nóng)村高碘區(qū)與非高碘區(qū)兒童智力均數(shù)不等,高碘區(qū)較低。兩樣本幾何均數(shù)比較的t檢驗見教材例8.4t檢驗的應(yīng)用條件:①樣本取自正態(tài)總體;②σ未知且n較小–單樣本t檢驗;③兩小樣本均數(shù)比較時,兩樣本的總體方差相等;若兩總體方差不齊可用t’檢驗;④兩大樣本均數(shù)比較時,可用Z檢驗。
正態(tài)性檢驗圖示法
方格坐標(biāo)紙圖正態(tài)概率紙圖
P-P圖(Proportion-proportionplots)統(tǒng)計檢驗方法W檢驗(S.S.ShapiroandM.B.Wilk)D檢驗(D’Agostino)方差齊性檢驗
根據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025上海市人力資源公共服務(wù)中心招聘輔助人員2人模擬筆試試題及答案解析
- 2025中國煤科煤礦災(zāi)害防控全國重點實驗室研發(fā)崗位招聘6人備考考試試題及答案解析
- 2025聊城東阿經(jīng)濟(jì)開發(fā)區(qū)管理委員會公開招聘工作人員補充說明考試備考題庫及答案解析
- 2026云南保山天潤高級中學(xué)在職教師招聘6人參考筆試題庫附答案解析
- 2025年信陽藝術(shù)職業(yè)學(xué)院招才引智公開招聘專業(yè)技術(shù)人員32名備考考試試題及答案解析
- 2025湖南郴州高新區(qū)綜合服務(wù)中心招募見習(xí)生6人備考考試試題及答案解析
- 2025年宿州煤電(集團(tuán))有限公司招聘71名模擬筆試試題及答案解析
- 2025甘肅嘉峪關(guān)市第三幼兒園招聘公益性崗位人員2人模擬筆試試題及答案解析
- 2025年天地(榆林)開采工程技術(shù)有限公司招聘(3人)參考筆試題庫附答案解析
- 2025安徽合肥市廬江縣鄉(xiāng)村振興投資有限公司招聘(第二批)考察模擬筆試試題及答案解析
- 基層銷售人員入職培訓(xùn)課程完整版課件
- 2023年郴州職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫及答案解析word版
- 西南大學(xué)PPT 04 實用版答辯模板
- D500-D505 2016年合訂本防雷與接地圖集
- 顱腦損傷的重癥監(jiān)護(hù)
- 《史記》上冊注音版
- JJF 1985-2022直流電焊機(jī)焊接電源校準(zhǔn)規(guī)范
- GB/T 19867.2-2008氣焊焊接工藝規(guī)程
- 國家開放大學(xué)《刑法學(xué)(1)》形成性考核作業(yè)1-4參考答案
- 商戶類型POS機(jī)代碼
- 臨床試驗監(jiān)查計劃
評論
0/150
提交評論