統(tǒng)計(jì)推論與顯著性檢驗(yàn)_第1頁
統(tǒng)計(jì)推論與顯著性檢驗(yàn)_第2頁
統(tǒng)計(jì)推論與顯著性檢驗(yàn)_第3頁
統(tǒng)計(jì)推論與顯著性檢驗(yàn)_第4頁
統(tǒng)計(jì)推論與顯著性檢驗(yàn)_第5頁
已閱讀5頁,還剩105頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

/sundae_meng社會(huì)統(tǒng)計(jì)第六講統(tǒng)計(jì)推論與顯著性檢驗(yàn)

?Ming-chiChen/sundae_mengPage.2Hypothesistesting假設(shè)檢定對(duì)於母體參數(shù)(parameter)的推估可以透過以下兩種方式:先估計(jì)參數(shù)的估計(jì)值,然後建構(gòu)出信賴區(qū)間。假設(shè)檢定:先給予母體未知數(shù)一個(gè)假設(shè)值,再利用樣本或?qū)嶒?yàn)結(jié)果來推斷此假設(shè)的可信度。?Ming-chiChen/sundae_mengPage.3Hypothesistesting假設(shè)檢定假設(shè)檢定假設(shè):從於一小撮觀察到的樣本中,提出的對(duì)於更一個(gè)大族群(母體)的某些性質(zhì)的陳述、臆測、推論。檢定:這種從觀察到的樣本所得出的推論是否合理。?Ming-chiChen/sundae_mengPage.4Hypothesistesting假設(shè)檢定檢定的假設(shè):“臺(tái)灣人民的平均教育年數(shù)為12年”“人社系男生的統(tǒng)計(jì)成績優(yōu)於女生”“贊成一國兩制的人不會(huì)超過百分之五”觀念?Ming-chiChen/sundae_mengPage.5Hypothesistesting假設(shè)檢定的原理假設(shè)檢定的基本原理:將”實(shí)際”觀察到的(observed)與”期望觀察到的”(expected)做比較。所謂”期望”是指在我們對(duì)於母體的陳述為真的條件下,我們期望觀察到….觀念?Ming-chiChen/sundae_mengPage.6Hypothesistesting假設(shè)檢定的步驟(1)將我們對(duì)於母體的臆測寫成假設(shè)陳述。(2)如果假設(shè)為真,則我們期望觀察到世界為…(3)檢查我們實(shí)際觀察到的世界,與在假設(shè)為真的情況下,我們期望觀察到的世界是否吻合。觀念?Ming-chiChen/sundae_mengPage.7Hypothesistesting假設(shè)檢定母體參數(shù)(parameter)為一個(gè)描述母體性質(zhì)的數(shù)量值。假設(shè)為關(guān)於母體參數(shù)有可能的數(shù)值的陳述(astatementaboutthevalueorsetofvaluesthataparameterorgroupofparameterscantake.)觀念?Ming-chiChen/sundae_mengPage.8ThenullhypothesisH0andthealternativehypothesisH1Thenullhypothesis(虛無假設(shè))H0是一組直接被檢定,關(guān)於對(duì)於母體參數(shù)值的假定。通常我們?cè)O(shè)定這個(gè)參數(shù)值為「無效果」。Thealternativehypothesis(對(duì)立假設(shè))H1或Haspecifiesanalternativesetofpossiblevaluesofthepopulationparameterthatarenotspecifiedinthenullhypothesis.不包含在虛無假設(shè)中的母體參數(shù)的可能值。Thetwohypothesesaremutuallyexclusive.這兩種假設(shè)為互斥。觀念?Ming-chiChen/sundae_mengPage.9假設(shè)檢定的基本原理如果H0為真,那我們看到特定樣本統(tǒng)計(jì)量的機(jī)率有多少?Exp.如果臺(tái)灣人平均月收入是3萬塊,那我們有多大機(jī)會(huì)在社會(huì)變遷調(diào)查中得到2.6萬的平均月所得?這個(gè)偏差很大嗎?利用前面提過的標(biāo)準(zhǔn)化常態(tài)分配的特質(zhì),或是這一講會(huì)說明的t分配特質(zhì),我們可以知道得到某個(gè)樣本統(tǒng)計(jì)量的機(jī)會(huì)為何。抽樣分配的特質(zhì)?Ming-chiChen/sundae_mengPage.10ThenullhypothesisH0andthealternativehypothesisH1Simplehypothesis簡單假設(shè):在統(tǒng)計(jì)假設(shè)之中只為一個(gè)數(shù)值之假設(shè),如:觀念Compositehypothesis複合假設(shè):在統(tǒng)計(jì)假設(shè)之中,其假設(shè)不只包含一個(gè)數(shù)值,而是一些數(shù)值的集合體,如:?Ming-chiChen/sundae_mengPage.11Nullhypothesisaboutapopulationproportion環(huán)保局宣稱20%的汽車的排氣設(shè)備被動(dòng)過手腳。欲檢定這個(gè)假設(shè),請(qǐng)寫出虛無假設(shè):例題虛無假設(shè)為對(duì)母體比率的一個(gè)描述,除非我們有充分的證據(jù)顯示虛無假設(shè)為偽,我們暫且假設(shè)它所描述的母體性質(zhì)為真。請(qǐng)寫出前例的相對(duì)假設(shè):One-sidedalternativehypothesis?Ming-chiChen/sundae_mengPage.12Onesidedalternativehypothesis消基會(huì)想要知道某廠牌的洗衣粉是否如同其包裝盒上所標(biāo)示的至少5公斤重,寫出虛無假設(shè)及相對(duì)假設(shè):例題One-sidedalternativehypothesis?Ming-chiChen/sundae_mengPage.13Two-sidedalternativehypothesis某公司購買新型的抽水機(jī),想知道與標(biāo)準(zhǔn)型有沒有差異。舊型抽水機(jī)每小時(shí)可抽5000加侖的水。虛無假設(shè)為:例題對(duì)立假設(shè)為:Two-sidedalternativehypothesis?Ming-chiChen/sundae_mengPage.14常用的假設(shè)例題?Ming-chiChen/sundae_mengPage.15Whichhypothesisisthenullhypothesis?(1)Inmanystatisticalapplications,thenullhypothesisshouldcorrespondtotheassumptionthatnochangeoccurswhensomenewprocessortechniqueistried.新的過程或技術(shù)沒有造成任何改變的假設(shè)。(如之前的抽水機(jī)例子)?Ming-chiChen/sundae_mengPage.16Whichhypothesisisthenullhypothesis?(2)Somestatisticiansarguethatthenullhypothesisshouldbethehypothesisthatthedecisionmakerwantstodisprove.希望被決策者否定的假設(shè)稱為虛無假設(shè)。Thatis,thenullhypothesisshouldspecifythevaluesofthepopulationparameterthattheresearcherthinksdoesnotrepresentthetruevalue(s)oftheparameter;thealternativehypothesisthenspecifiesthevaluesoftheparameterthattheresearcherbelievesdohold.虛無假設(shè)中所假設(shè)的母體參數(shù)值為研究者認(rèn)為不對(duì)的母體參數(shù)值。?Ming-chiChen/sundae_mengPage.17Whichhypothesisisthenullhypothesis?(3)anothercommonpracticeistoassignnospecialmeaningtoeitherthenullorthealternativehypothesis,buttoletthesehypothesesmerelyrepresenttwodifferentassumptionsaboutthepopulationparameter.不特別去區(qū)分虛無假設(shè)及對(duì)立假設(shè)的意義,讓兩者各自代表母體參數(shù)的一個(gè)可能值。?Ming-chiChen/sundae_mengPage.18Whichhypothesisisthenullhypothesis?消基會(huì)接獲很多消費(fèi)者的抱怨,想調(diào)查超市中五磅的碎牛肉是否不夠重量。虛無及對(duì)立假設(shè)為:例題?Ming-chiChen/sundae_mengPage.19Whichhypothesisisthenullhypothesis?市政府所用的紅綠燈平均壽命為2000小時(shí),一家新的製造商宣稱他們的產(chǎn)品比原來的壽命要長,且價(jià)格相同。市府想要測試新燈泡的壽命是否超過2000小時(shí),虛無假設(shè)為:例題?Ming-chiChen/sundae_mengPage.20Whichhypothesisisthenullhypothesis?一家公司的產(chǎn)品為30%的消費(fèi)者所採用(p=.30),公司在某些區(qū)域測試新推出的廣告是否增加銷售,其虛無假設(shè)為:例題?Ming-chiChen/sundae_mengPage.21Whichhypothesisisthenullhypothesis?汽車車門的油漆平均五年會(huì)開始脫落,某科學(xué)家宣稱新的油漆壽命比較長,汽車公司想測試新油漆的壽命:例題?Ming-chiChen/sundae_mengPage.22ConsequencesofchoosingH0andH1Thenullhypothesishasthestatusofamaintainedhypothesisthatwillnotberejectedbecauseitisassumedtobetrueunlessthesampledataprovidestrongcontraryevidence.由於我們只有在證據(jù)很充分的情況下才能推翻虛無假設(shè),因此虛無假設(shè)比對(duì)立假設(shè)佔(zhàn)據(jù)更有利的地位,假設(shè)的寫法對(duì)於結(jié)果有很大影響。觀念?Ming-chiChen/sundae_mengPage.23ConsequencesofchoosingH0andH1衛(wèi)生署在核準(zhǔn)新藥上市中,面臨以下兩個(gè)可能的結(jié)果:一、新藥對(duì)於病患有益。二、新藥對(duì)於病患無益處。兩者都可以被選為nullhypothesis觀念?Ming-chiChen/sundae_mengPage.24ConsequencesofchoosingH0andH1衛(wèi)生署選擇以下的方式:H0:新藥對(duì)於大眾A沒有益處不應(yīng)該上市。H1:新藥對(duì)於大眾有益處。此時(shí)藥廠必須舉證推翻H0,否則衛(wèi)生署不會(huì)核準(zhǔn)新藥上市。由於這種假設(shè)方式,新藥上市過程十分冗長,但好處為有害藥物要上市十分困難。觀念?Ming-chiChen/sundae_mengPage.25ConsequencesofchoosingH0andH1如果衛(wèi)生署選擇以下列的方式來核準(zhǔn)新藥:H0:新藥對(duì)於病患有益處且應(yīng)上市。H1:新藥對(duì)於病患沒有益處不應(yīng)該上市。此時(shí)除非有強(qiáng)而有力的證據(jù)顯示藥物無效或有害,否則暫且假定此藥為有益處的。這種方式可以使新藥快速上市,但風(fēng)險(xiǎn)也很高。觀念?Ming-chiChen/sundae_mengPage.26ConsequencesofchoosingH0andH1在假設(shè)檢定中,我們能夠計(jì)算下列機(jī)率:P(theoryistrue|observeddata)即給定目前觀察到的樣本資料,理論為真的條件機(jī)率為何?但實(shí)際上,我們計(jì)算的條件機(jī)率為:P(observeddata|theoryistrue)即在假設(shè)理論為真的前提下,觀察到目前樣本資料的機(jī)率為何?觀念?Ming-chiChen/sundae_mengPage.27ConsequencesofchoosingH0andH1如果理論為真,則樣本資料應(yīng)比較有可能呈現(xiàn)…比較不可能為…。若觀察到與理論一致的樣本(較有可能發(fā)生的樣本),則暫且假定理論為真。若觀察到樣本在理論為真的假設(shè)下不太可能發(fā)生,則推翻理論。觀念?Ming-chiChen/sundae_mengPage.28Decisionrules根據(jù)樣本所提供的資訊,我們面臨兩種可能的決定:一、拒絕接受nullhypothesis(rejectingH0)二、無法推翻nullhypothesis(notrejectingH0)有時(shí)候統(tǒng)計(jì)學(xué)者會(huì)說接受acceptednullhypothesis,不過較為正確的說法應(yīng)該是無法拒絕或無法推翻H0。觀念?Ming-chiChen/sundae_mengPage.29Decisionrules推翻nullhypothesis的決策法則:我們根據(jù)檢定統(tǒng)計(jì)量(teststatistics)來決定是否推翻虛無假設(shè),如樣本平均數(shù)、樣本比率、Z或t值等。Teststatistic:ateststatisticisarandomvariablewhosevalueisusedtodeterminewhetherwerejectthenullhypothesis.觀念?Ming-chiChen/sundae_mengPage.30DecisionrulesDecisionrule:ThedecisionrulespecifiesthesetofvaluesoftheteststatisticforwhichthenullhypothesisH0isrejectedinfavorofH1andthesetofvaluesforwhichH0isaccepted(i.e.,notrejected).假設(shè)檢定中的決策法則為決定推翻或無法推翻假設(shè)的檢定統(tǒng)計(jì)量的範(fàn)圍值。觀念?Ming-chiChen/sundae_mengPage.31RejectionRegionandAcceptanceRegion根據(jù)決策法則我們可以將檢定統(tǒng)計(jì)量分成窮盡及互斥的兩組數(shù)值區(qū)域:Therejectionregion

(危險(xiǎn)域或拒絕域)ofatest,alsocalledthecriticalregion(棄卻域),consistsofallvaluesoftheteststatisticforwhichH0isrejected.Theacceptanceregion

(接受域)consistsofallvaluesoftheteststatisticforwhichH0

isnotrejected.觀念?Ming-chiChen/sundae_mengPage.32CriticalValue臨界值Thecriticalvalueoftheteststatisticisthevaluethatseparatesthecriticalregionfromtheacceptanceregion.區(qū)分拒絕域及接受域的界線。單邊對(duì)立假設(shè)(one-sidedalternativehypothesis)有一個(gè)臨界值;雙邊對(duì)立假設(shè)有兩個(gè)臨界值。觀念?Ming-chiChen/sundae_mengPage.33Decisionrules統(tǒng)計(jì)檢定有點(diǎn)像法院中的陪審團(tuán)在審理案件(虛無假設(shè)受到審判),在樣本資料還沒有充分證據(jù)顯示「有罪」之前,我們暫且假定虛無假設(shè)為真。在法院的審判中有兩種可能的錯(cuò)誤:無罪的人被誤判為有罪,有罪的人被無罪釋放。正如同法院的審判,檢定有兩種犯錯(cuò)的可能:nullhypothesis在正確的情況下被推翻(typeIerror錯(cuò)殺無辜)及nullhypothesis不正確但沒有被拒絕(typeIIerror縱放壞人)。觀念?Ming-chiChen/sundae_mengPage.34TypeIandTypeIIErrors用樣本資料去推論母體未知參數(shù)時(shí),由於抽樣的偏差,可能產(chǎn)生推論的誤謬。觀念?Ming-chiChen/sundae_mengPage.35TypeIandTypeIIErrors型I誤差:當(dāng)H0為真,但檢定結(jié)果拒絕H0。型II誤差:當(dāng)H0不真,但檢定結(jié)果不拒絕H0。觀念?Ming-chiChen/sundae_mengPage.36LevelofSignificance(αrisk)顯著水準(zhǔn):typeIerror發(fā)生的最大機(jī)率值。ThelevelofsignificanceofatestistheprobabilitythattheteststatisticfallsinthecriticalregiongiventhatH0istrue.Thelevelofsignificanceisdenotedbythesymbolα觀念?Ming-chiChen/sundae_mengPage.37ProbabilityofaTypeIIError(βrisk)β風(fēng)險(xiǎn):typeIIerror發(fā)生的最大機(jī)率值。TheprobabilityofmakingaTypeIIerroristheprobabilitythattheteststatisticfallsintheacceptanceregionwhenthenullhypothesisisfalse,

denotedbyβ觀念?Ming-chiChen/sundae_mengPage.38ExampleofaTypeIErrorUSAToday報(bào)導(dǎo)在美國非法賭博的金額至少平均每人每年$200,妳覺得這個(gè)數(shù)字太過於誇張,因此找了n個(gè)人的樣本來估計(jì)每年非法賭博的平均金額。妳想要檢定的虛無假設(shè)為:H0:μ≧$200對(duì)立假設(shè)為H1:μ<$200假設(shè)真正的母體平均數(shù)為$200,如果妳估計(jì)的樣本平均遠(yuǎn)低於$200,則妳會(huì)推翻正確的假設(shè),而犯下型I誤謬。例題?Ming-chiChen/sundae_mengPage.39ExampleofaTypeIIError如果實(shí)際非法賭博的金額遠(yuǎn)低於$200,即H0並不正確,但妳運(yùn)氣欠佳,找到的樣本中估計(jì)的平均值十分接近200,則妳應(yīng)該推翻H0但資料卻不足以推翻錯(cuò)誤的假設(shè),此時(shí)妳犯了型II的誤謬。這兩種錯(cuò)誤都與抽樣時(shí)運(yùn)氣不佳有關(guān)係。例題?Ming-chiChen/sundae_mengPage.40Implicationsofrejectingoracceptingthenullhypothesis當(dāng)檢定統(tǒng)計(jì)量落在拒絕域(rejectionregion)內(nèi),不代表我們證明(prove)虛無假設(shè)為錯(cuò)誤的。只能說我們對(duì)於虛無假設(shè)所陳述的內(nèi)容真實(shí)性有很大的懷疑--虛無假設(shè)不是不正確,就是極不可能發(fā)生。同理,當(dāng)檢定統(tǒng)計(jì)量落在接受域中,並不是證明(prove)虛無假設(shè)為真,僅是表示證據(jù)不足以推翻我們的假設(shè)。觀念?Ming-chiChen/sundae_mengPage.41Implicationsofrejectingoracceptingthenullhypothesis虛無假設(shè)在檢定前被視為是正確的,除非有充分的證據(jù),不然我們不輕易推翻假設(shè)。通常我們選擇極小的顯著水準(zhǔn)如.01或.05來確保我們不會(huì)推翻一個(gè)正確的虛無假設(shè)。觀念?Ming-chiChen/sundae_mengPage.42TestingHypothesisaboutaPopulationMeanWhenVarianceisKnownH0:u=u0,H1:u<u0我們以樣本的平均數(shù)X來推論母體的平均數(shù)。假設(shè)母體為常態(tài)分配,如果H0為真,則樣本平均數(shù)X~N(u0,σ2/n)。只有當(dāng)我們觀察到一個(gè)樣本平均數(shù)與u0差異很大時(shí)才會(huì)推翻H0,觀念u0σ2/nAreaαRejectH0ifandonlyiftheobservedsamplemeanx-barislessthanthecriticalvalue?Ming-chiChen/sundae_mengPage.43TestingHypothesisaboutaPopulationMeanWhenVarianceisKnown如果H0為真,則樣本平均數(shù)落在criticalvalue之下的機(jī)率為:觀念u0σ2/nAreaα?Ming-chiChen/sundae_mengPage.44我們刻意選擇x*這一點(diǎn)使顯著水準(zhǔn)為α,也就是說,我們將檢定犯下型I誤謬的機(jī)率,這個(gè)機(jī)率是我們事先決定好的α。也可以直接以p值來表示。p值就是犯型I錯(cuò)誤的機(jī)率,也就是錯(cuò)誤地拒斥正確的虛無假設(shè)的機(jī)率。我們往往希望這個(gè)機(jī)率越小越好,也就是給虛無假設(shè)thebenefitofdoubt:無罪推定、科學(xué)或醫(yī)藥衛(wèi)生單位的謹(jǐn)慎。?Ming-chiChen/sundae_mengPage.45Thecriticalvalue觀念u0σ2/nAreaα將criticalvalue轉(zhuǎn)成z-score01Areaα?Ming-chiChen/sundae_mengPage.46Thecriticalvalue觀念如果H0為真,01Areaα?Ming-chiChen/sundae_mengPage.47Thecriticalvalue觀念欲檢證H0:u=u0vs.H1:u<u0則criticalvalue:01Areaα?Ming-chiChen/sundae_mengPage.48檢定常態(tài)分配母體的平均值,且母體變異數(shù)已知觀念(1)寫出H0

和H1(2)決定顯著水準(zhǔn)α(3)查表找出在顯著水準(zhǔn)為α下的criticalvalue-zα(4)取得n樣本並計(jì)算樣本平均數(shù)x(5)計(jì)算observedz-score或找出-zα所對(duì)應(yīng)的臨界點(diǎn)如果z<-zαRejectH0

?(6)決定是否拒絕需無假設(shè)?Ming-chiChen/sundae_mengPage.49檢定常態(tài)分配母體的平均值,且母體變異數(shù)已知觀念(1)寫出H0

和Ha(2)決定顯著水準(zhǔn)α(一般為5%,1%,10%)(3)查表找出在顯著水準(zhǔn)為α下的criticalvalue單尾–zα雙尾–zα/2(4)取得n樣本並計(jì)算樣本平均數(shù)x?Ming-chiChen/sundae_mengPage.50Testingthemeanofanormalpopulationwithpopulationvarianceknown例題某公司生產(chǎn)鑽油井用的鑽頭,宣稱其平均壽命為32呎,變異數(shù)為16呎。有客戶認(rèn)為該公司誇大,抽取25支樣本來做檢證,得樣本平均數(shù)為29.5(方法一)(1)H0:u=32vs.H1:u<32(2)α=.05(3)-zα=-z.05=-1.64501reject?Ming-chiChen/sundae_mengPage.51Testingthemeanofanormalpopulationwithpopulationvarianceknown例題某公司生產(chǎn)鑽油井用的鑽頭,宣稱其平均壽命為32呎,變異數(shù)為16呎。有客戶認(rèn)為該公司誇大,抽取25支樣本來做檢證,得樣本平均數(shù)為29.5(方法二)(1)H0:u=32vs.H1:u<32(2)α=.05324?Ming-chiChen/sundae_mengPage.52Testingthemeanofanormalpopulationwithpopulationvarianceknown例題前例中我們拒絕H0:u=32並不是證明真正的母體平均數(shù)一定小於32;而是說如果H0為真,則我們抽取25個(gè)樣本計(jì)算樣本平均數(shù)得到29.5這個(gè)平均值的機(jī)率小於0.05。換句話說,如果u=32,則在所有可能的樣本平均數(shù)中,僅有不到5%的樣本會(huì)得到小於-1.645的z-score。?Ming-chiChen/sundae_mengPage.53TestingaCompositeNullHypothesis觀念教師工會(huì)罷工,宣稱老師的平均薪資$25000,但議會(huì)認(rèn)為高於$25000。議員不想在證據(jù)不夠充分之下駁斥工會(huì)的看法,因此將顯著水準(zhǔn)設(shè)於1%:H0:u$25,000vs.H1:u>$25,000假設(shè)薪資為常態(tài)分配,且母體標(biāo)準(zhǔn)差為=$4,000。取得100個(gè)老師薪資的隨機(jī)樣本,得樣本平均數(shù)為$27,000。檢定上述的假設(shè)。?Ming-chiChen/sundae_mengPage.54TestingaCompositeNullHypothesis觀念在顯著水準(zhǔn)為

=.01,criticalvalueZ

=Z.01=2.33.02.33Rejectthenullhypothesis?Ming-chiChen/sundae_mengPage.55小結(jié):設(shè)立假設(shè)的原則將想要利用樣本統(tǒng)計(jì)量去驗(yàn)證的假設(shè)設(shè)為對(duì)立假設(shè),想要否定的假設(shè)設(shè)為虛無假設(shè)。錯(cuò)誤地拒絕某一假設(shè)(typeIerror)的後果較錯(cuò)誤地接受或不拒絕該假設(shè)的後果為嚴(yán)重者(typeIIerror),將該假設(shè)設(shè)為虛無假設(shè)。例如無罪假設(shè)、新藥無益患者。將他人的主張作為虛無假設(shè),亦即假定他人的主張是真實(shí)的。以反面主張作為虛無假設(shè)。例如我們想知道新制度是否優(yōu)於舊制度。?Ming-chiChen/sundae_mengPage.56小結(jié):虛無假設(shè)與社會(huì)理論在進(jìn)行社會(huì)學(xué)研究時(shí),研究者通常會(huì)想對(duì)理論做出貢獻(xiàn),也就是說研究者希望其理論優(yōu)於對(duì)於同一社會(huì)現(xiàn)象的既有理論解釋。所以,研究者通常把既有理論當(dāng)成是虛無假設(shè)來做假設(shè)檢定。?Ming-chiChen/sundae_mengPage.57小結(jié):假設(shè)檢定的步驟步驟一:建立虛無假設(shè)與對(duì)立假設(shè)步驟二:選擇檢定統(tǒng)計(jì)量(樣本平均數(shù))步驟三:選擇顯著水準(zhǔn)α並決定決策法則(臨界值與拒絕及接受域)步驟四:比較檢定統(tǒng)計(jì)量與臨界值步驟五:下結(jié)論?Ming-chiChen/sundae_mengPage.58雙尾檢定Atwo-tailedtestofthepopulationmean觀念H0:u=u0vs.H1:uu0如果觀察到的樣本平均數(shù)遠(yuǎn)高於或遠(yuǎn)低於u0則皆可拒絕H00/2/2Acceptanceregion1-

RejectH0ifz<-z/2orifz>z/2RejectH0if?Ming-chiChen/sundae_mengPage.59Atwo-tailedtestofthepopulationmean觀念雙尾檢定最常用的顯著水準(zhǔn)為10%,5%,1%,其相對(duì)應(yīng)的criticalz-score為:0/2/2Acceptanceregion1-

?Ming-chiChen/sundae_mengPage.60Atwo-tailedtestofameanofanormalpopulationwithknownvariance例題國會(huì)議員經(jīng)常出國考察,某報(bào)紙媒體宣稱這類的考察平均每日花費(fèi)$300,標(biāo)準(zhǔn)差

=$50。抽取25名國會(huì)議員得到樣本平均數(shù)為$260,在5%的顯著水準(zhǔn),報(bào)紙媒體的宣稱合不合理?H0:u=300H1:u3000/2/2=.25Acceptanceregion1-

-1.961.96?Ming-chiChen/sundae_mengPage.61Atwo-tailedtestofameanofanormalpopulationwithknownvariance例題求上例中的樣本平均數(shù)的criticalvalue?300/2/2=.025Acceptanceregion1-

280.4319.6?Ming-chiChen/sundae_mengPage.62Statisticalsignificancevs.practicalsignificance觀念某都會(huì)新貴認(rèn)為鄉(xiāng)下婦女較無知。欲檢證城鄉(xiāng)婦女的語言能力是否真的有差異?某語言能力測驗(yàn)共測驗(yàn)200個(gè)單字,答對(duì)一題2分,部分答對(duì)給1分,假設(shè)從過去的資料得知城市婦女的平均分?jǐn)?shù)為u=148,

=10,今取6400個(gè)鄉(xiāng)村婦女做為樣本,得平均分?jǐn)?shù)為147,請(qǐng)問城鄉(xiāng)婦女的語言能力是否有別?H0:u=148,H1:u<148?Ming-chiChen/sundae_mengPage.63Statisticalsignificancevs.practicalsignificance觀念雖然證據(jù)顯示城鄉(xiāng)婦女的語言能力的確有的差異,但假設(shè)其差異僅有1分,在實(shí)際上這個(gè)差距並不大。假設(shè)檢定的z值公式中,樣本數(shù)愈大,z值會(huì)愈大,即愈有可能拒絕H0。即使樣本平均數(shù)與母體平均數(shù)的差異很小,也有可能因?yàn)閚過大而拒絕H0?Ming-chiChen/sundae_mengPage.64例題在母體為常態(tài)分配N(u,

2)的假設(shè)下,回答下列問題:單邊檢定H0:u25H1:u>25樣本數(shù)n=81,標(biāo)準(zhǔn)差=18,顯著水準(zhǔn)為0.1時(shí),決策規(guī)則為:若u=24,根據(jù)上述的決策規(guī)則,犯下typeIerror的機(jī)率為何?若u=25,根據(jù)上述的決策規(guī)則,犯下typeIerror的機(jī)率為何?若u=29,根據(jù)上述的決策規(guī)則,犯下typeIIerror的機(jī)率為何??Ming-chiChen/sundae_mengPage.6527.56拒絕接受242529?Ming-chiChen/sundae_mengPage.66例題若u=24,根據(jù)上述的決策規(guī)則,犯下typeIerror的機(jī)率為何?若u=25,根據(jù)上述的決策規(guī)則,犯下typeIerror的機(jī)率為何?若u=29,根據(jù)上述的決策規(guī)則,犯下typeIIerror的機(jī)率為何?不真?Ming-chiChen/sundae_mengPage.67例題從一個(gè)變異數(shù)為2250的母體裡抽取一個(gè)大小為100的樣本來檢測下列假設(shè):H0:u=1000,H1:u1000ItisdecidedtorejectH0ifFindtheprobabilityoftypeIerrorFindtheprobabilityofatypeIIerrorifu=1005?Ming-chiChen/sundae_mengPage.68例題FindtheprobabilityofatypeIIerrorifu=1005?Ming-chiChen/sundae_mengPage.69P-Value:InterpretationandUse在假設(shè)檢定中,我們通常會(huì)事先決定顯著水準(zhǔn)α,然後根據(jù)決定之後的α值找出拒絕域及接受域。但在很多的情況下,我們無法預(yù)估typeI誤謬及typeII誤謬的成本,因此可以選擇任意的α值。所以有時(shí)候我們直接指出得到觀察統(tǒng)計(jì)量的機(jī)率。複習(xí):顯著水準(zhǔn)α=型I誤差發(fā)生最大的機(jī)率值。?Ming-chiChen/sundae_mengPage.70P-Value:InterpretationandUseTheP-valueofatestistheprobabilityofobtainingavalueoftheteststatisticsasextremeasormoreextremethantheobservedsamplevaluewhenthenullhypothesisistrue.P-value告訴我們:「如果虛擬假設(shè)為真,我們觀察到目前資料顯示的檢定統(tǒng)計(jì)量的機(jī)率有多高?」如果這個(gè)機(jī)率很小,則我們可以拒絕虛擬假設(shè),因?yàn)槿绻僭O(shè)為真,則僅有很小的機(jī)率抽取任意的隨機(jī)樣本會(huì)得到目前的觀察值。?Ming-chiChen/sundae_mengPage.71Testingthemeanofanormalpopulationwithpopulationvarianceknown例題某公司生產(chǎn)鑽油井用的鑽頭,宣稱其平均壽命為32呎,變異數(shù)為16呎。有客戶認(rèn)為該公司誇大,抽取25支樣本來做檢證,得樣本平均數(shù)為29.5H0:u=32vs.H1:u<32α=.05-zα=-z.05=-1.64501reject?Ming-chiChen/sundae_mengPage.72Testingthemeanofanormalpopulationwithpopulationvarianceknown例題求p-value=?P-value=P(z<-3.125)=0.000901Z=-3.125如果H0為真,則觀察到平均值=29.5的機(jī)率僅有.0009,表示H0不太可能為真

rejectedH0?Ming-chiChen/sundae_mengPage.73Testingthemeanofanormalpopulationwithpopulationvarianceknown例題將α訂在5%,則criticalvalue=-1.645如果將α定在1%的水準(zhǔn),則criticalvalue=-2.33,我們依舊rejectH0只要是顯著水準(zhǔn)高於.0009,我們都可以拒絕H0,也就是說,P-value是H0會(huì)被拒絕的最小值。01Z=-3.125?Ming-chiChen/sundae_mengPage.74Testingthemeanofanormalpopulationwithpopulationvarianceknown例題因此P-value是不僅止於告訴我們?cè)谀骋伙@著水準(zhǔn)下是否拒絕H0,如果我們知道P-value=.002則我們知道H0不但在.05的顯著水準(zhǔn)下會(huì)被拒絕,在.005的水準(zhǔn)下也會(huì)被拒絕。如果僅知道P-value=.04,則是否拒絕H0可以由讀者來決定,如果某一研究人員覺得.01才算顯著,則H0不會(huì)被拒絕,如果將顯著水準(zhǔn)置於.05,則拒絕。?Ming-chiChen/sundae_mengPage.75Testingthemeanofanormalpopulationwithpopulationvarianceknown當(dāng)我們沒有什麼特別的理由來支持我們選擇一個(gè)特別的顯著水準(zhǔn),或是當(dāng)我們無法確知犯了型I錯(cuò)誤或型II錯(cuò)誤的成本或結(jié)果時(shí),p值法特別適用?Ming-chiChen/sundae_mengPage.76Testingthemeanofanormalpopulationwithpopulationvarianceknown一般在研究報(bào)告中,研究者經(jīng)常直接寫出p-value而讓讀者自己去決定是否要拒絕H0。p-value經(jīng)常被稱為是觀察到的顯著水準(zhǔn)(theobservedsignificantlevel)??梢詫⑺闯墒恰冈诩僭O(shè)H0為真的情況下,觀察到目前樣本,或比此樣本更極端樣本的機(jī)率」。Astatisticallysignificantp-valuemeansthattheobservedresultisdifficulttoexplainbyrandomchance.

?Ming-chiChen/sundae_mengPage.77樣本數(shù)n愈大,p-value值愈…?P-value與樣本數(shù)的大小有很大的關(guān)係。當(dāng)樣本數(shù)很大時(shí),些微的差距也會(huì)讓Z變的很大,也就是說,p-value會(huì)變得很小。?Ming-chiChen/sundae_mengPage.7811.4TestingHypothesesAboutaPopulationMeanwithLargeSampleSizes在前面的假設(shè)檢定討論中,我們學(xué)到如何判定有關(guān)於一常態(tài)分配(normal),且變異數(shù)

已知的母體平均數(shù)之虛擬假設(shè)。這是因?yàn)槲覀冎廊绻阁w為常態(tài)分配,且母體變異數(shù)為u,則樣本平均數(shù)的分佈為~N(u0,

2/n)如果我們無法確切知道母體是否為常態(tài)分配,也不知道母體的變異數(shù),則我們的假設(shè)檢定還能成立嗎??Ming-chiChen/sundae_mengPage.7911.4TestingHypothesesAboutaPopulationMeanwithLargeSampleSizes根據(jù)中央極限定律CentralLimitTheorem,如果樣本數(shù)夠大(n>30),即使母體不是常態(tài)分配,樣本平均數(shù)X的抽樣分配也會(huì)趨近於常態(tài)分佈。而且如果樣本數(shù)夠大,我們可以用樣本的變異數(shù)s來取代母體變異數(shù)

。?Ming-chiChen/sundae_mengPage.80Two-tailedtestofapopulationmeanusingalargesample某公司生產(chǎn)冷暖氣用的導(dǎo)管,導(dǎo)管上必須鑽許多小孔以便鎖入螺絲釘,如果鑽孔機(jī)正常運(yùn)作,則鑽出的小孔平均直徑為10公釐,但變異數(shù)不知道。但如果鑽孔機(jī)運(yùn)作不正常,則小孔不是過大就是太小。這家冷氣公司的老闆想要驗(yàn)證某臺(tái)鑽孔機(jī)是否正常運(yùn)作,即H0:u=10v.s.H1:u10這個(gè)老闆檢視了由這臺(tái)鑽孔機(jī)鑽出的100個(gè)小孔,得到平均直徑為9.6公釐,樣本變異數(shù)為s=1公釐。以5%的顯著水準(zhǔn)來檢驗(yàn)此機(jī)器是否正常??Ming-chiChen/sundae_mengPage.81Two-tailedtestofapopulationmeanusingalargesampleSolution:由於樣本數(shù)夠大(n=100)我們可以用一般檢定母體平均值假設(shè)的方法來進(jìn)行檢證:

=5%,twotailedtest,thetwocriticalvaluez1=-1.96,z2=1.960/2/2=.25Acceptanceregion-1.961.96RejectH0?Ming-chiChen/sundae_mengPage.82FindingthecriticalvaluesofX-barwhenvarianceisunknown找出前例中x的criticalvalue/2/2=.25Acceptanceregion9.80410.196?Ming-chiChen/sundae_mengPage.83TestingHypothesisaboutthemeanofanormalpopulationwithunknownvariance如果母體為常態(tài)分配,但母體的變異數(shù)為未知,且樣本數(shù)少於30?改用studentt分配而非用常態(tài)分配來做假設(shè)檢證。?Ming-chiChen/sundae_mengPage.84複習(xí):母體平均數(shù)的假設(shè)檢定方法臨界值法(檢定統(tǒng)計(jì)量檢定法)標(biāo)準(zhǔn)統(tǒng)計(jì)量檢定法(Z值法)信賴區(qū)間法p值法?Ming-chiChen/sundae_mengPage.85Student’stdistribution若母體~N(,2),則若母體

2未知,則以S來取代,我們得到t-score:隨著樣本數(shù)愈大,S愈接近,t分配愈接近標(biāo)準(zhǔn)常態(tài)分配Z:?Ming-chiChen/sundae_mengPage.86CharacteristicsoftdistributionThetdistributionisactuallyafamilyofdistributionwithadifferentdensityfunctioncorrespondingtoeachdifferentvalueoftheparameter.Standardnormal(d.f.=)d.f.=4d.f.=2d.f.=1?Ming-chiChen/sundae_mengPage.87Valueoft,Thesymbolt,denotesthevalueoftsuchthattheareatoitsrightis

andthasdegreeoffreedom.Thevaluet,satisfiestheequation:P(t>t,)=Wheretherandomvariablethasthetdistributionwithdegreesoffreedom.?Ming-chiChen/sundae_mengPage.88TestingHypothesisaboutthemeanofanormalpopulationwithunknownvariance欲檢證下列假設(shè):H0:u=u0orH0:uu0H1:u>u0在顯著水準(zhǔn)之下,找出criticalvaluet,P(t>

t,

)=計(jì)算t-score:決策法則:rejectH0infavorofH1ift>t,n-1

?Ming-chiChen/sundae_mengPage.89TestingHypothesisaboutthemeanofanormalpopulationwithunknownvariance欲檢證下列假設(shè):H0:u=u0orH0:u

u0H1:u<u0在顯著水準(zhǔn)之下,找出criticalvaluet,P(t>

t,

)=計(jì)算t-score:決策法則:rejectH0infavorofH1ift<-t,n-1

?Ming-chiChen/sundae_mengPage.90TestingHypothesisaboutthemeanofanormalpopulationwithunknownvariance欲檢證下列假設(shè):H0:u=u0

H1:uu0在顯著水準(zhǔn)之下,找出criticalvaluet,P(t>

t,

)=計(jì)算t-score:決策法則:rejectH0infavorofH1ift<-t/2,n-1ort>t/2,n-1

?Ming-chiChen/sundae_mengPage.91例:small-sampletestofthemeanofanormalpopulationwithunknownvariance某汽車製造商宣稱該公司一款低價(jià)車肇事平均修車費(fèi)低於等於$200。消費(fèi)者基金會(huì)認(rèn)為修車費(fèi)高於此數(shù)值,欲檢證下列假設(shè):H0:u

u0

H1:u>u0消費(fèi)者基金會(huì)不願(yuàn)在證據(jù)不充分的條件下,隨意駁斥製造商的宣稱,因此將假設(shè)檢定的顯著水準(zhǔn)嚴(yán)格地定在1%。因?yàn)闄z證肇事修車的成本甚高,因此消基會(huì)僅找了9個(gè)樣本,發(fā)現(xiàn):x1=245,x2=305,x3=175,x4=250,x5=280,x6=160,x7=250,x8=195,x9=210?Ming-chiChen/sundae_mengPage.92例:small-sampletestofthemeanofanormalpopulationwithunknownvariance解)x1=245,x2=305,x3=175,x4=250,x5=280,x6=160,x7=250,x8=195,x9=210計(jì)算樣本平均值:d.f.=9-1=8,Criticalvalue=t.01,8=2.896?Ming-chiChen/sundae_mengPage.93例:small-sampletestofthemeanofanormalpopulationwithunknownvariance或者我們可以用t=1.86找出其相對(duì)應(yīng)的p-value查表B可知,d.f.=8P(t>1.86)=.05若d.f.=8,t=1.49,P(t>1.49)=?若d.f.=8,t=1.16,P(t>1.16)=??Ming-chiChen/sundae_mengPage.94Testsofthepopulationproportion.在前一講中,我們指出如果母體的比率為p(清華同學(xué)贊成清交合併的比例),且np5andnq5,則樣本比率p^為一常態(tài)分配~N(p,pq/n),q=1-p,?Ming-chiChen/sundae_mengPage.95SamplingDistributionoftheSampleProportionTheNormalApproximationRuleforProportion:母體(全體清華同學(xué))中具有某種特質(zhì)(贊成清交合併)的個(gè)體比例為p,從中選取大小為n的樣本,我們知道我們有很多大小為n的可能樣本,我們以X來代表個(gè)別樣本中贊成清交合併的比例,比如說我們?nèi)〉玫牡谝粋€(gè)樣本(n=200)中,贊成清交合併的有90人(p1=0.45);第二個(gè)大小一樣的樣本(n=200)贊成合併的比例p2=0.44;如此一直下去,直到窮盡所有的樣本為止。我們知道每一個(gè)可能樣本的比例p^=X/n,這些樣本的p^本身也有一個(gè)分配,我們稱之為比例的抽樣分配,如果np5,而且nq5(記得q=1-p),那麼:?Ming-chiChen/sundae_mengPage.96SamplingDistributionoftheSampleProportionIfthedistributionofp^isapproximatelynormal,thenrandomvariable?Ming-chiChen/sundae_mengPage.9711.6Testsofthepopulationproportion設(shè)np5andnq5檢證下列假說:H0:p=p0orH0:pp0H1:p<p0如果H0為真,則樣本比率~N(p0,p0q0/n)RejectH0ifZ<-z

orp^<p^*?Ming-chiChen/sundae_mengPage.98例:TestingapopulationProportion立法委員宣稱民調(diào)顯示60%的民眾支持核四復(fù)建,環(huán)保團(tuán)體宣稱支持復(fù)建的民眾不會(huì)超過60%,妳用100的樣本來驗(yàn)證:H0:p=.6v.s.H1:p<.6假設(shè)55個(gè)樣本支持核四復(fù)建,以5%的顯著水準(zhǔn),我們可以推翻立法院的說法嗎??Ming-chiChen/sundae_mengPage.99例:TestingapopulationProportion解答如果H0為真,那麼隨機(jī)變數(shù)p^的分配為一個(gè)均數(shù)p=.6而變異數(shù)pq/n=(.6)(.4)/100=.0024的常態(tài)分配。如果我們用單

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論