[數(shù)學(xué)]統(tǒng)計學(xué)第10講-第10章-單樣本顯著性檢驗.ppt_第1頁
[數(shù)學(xué)]統(tǒng)計學(xué)第10講-第10章-單樣本顯著性檢驗.ppt_第2頁
[數(shù)學(xué)]統(tǒng)計學(xué)第10講-第10章-單樣本顯著性檢驗.ppt_第3頁
[數(shù)學(xué)]統(tǒng)計學(xué)第10講-第10章-單樣本顯著性檢驗.ppt_第4頁
[數(shù)學(xué)]統(tǒng)計學(xué)第10講-第10章-單樣本顯著性檢驗.ppt_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第10章 單樣本顯著性檢驗,10.1 導(dǎo)論:平均數(shù)的抽樣分布,1. 如何比較抽樣分布的均數(shù)與樣本來自的總體均數(shù)?,2. 當增加抽樣分布的樣本量時,樣本平均數(shù)如何變化?,例1:大學(xué)生艾滋病知識問卷測試。設(shè)總體=50,=10。有多少大學(xué)生在40分到60分之間呢?,圖10-1a,隨機抽取一個大樣本,其個體分數(shù)的分布見圖10-1(a),如果抽取樣本量N=3的100個個樣本,計算每個樣本平均數(shù),圖10-1b,如果抽取N=20的100個個樣本,計算每個樣本平均數(shù),圖10-1c,樣本平均數(shù)與總體平均數(shù)相差較小,如果抽取樣本容量N=40的100個樣本,計算每個樣本平均數(shù),圖10-1d,從總體抽取一個樣本的分布

2、,總面積的68%,=個體分數(shù)方差,樣本平均數(shù)的分布,總面積的68%,=樣本均數(shù)的方差,=樣本均數(shù)的標準差,樣本平均數(shù)的平均數(shù)的標準差,就稱為均數(shù)的標準誤(standard error of mean),如果總體標準差已知,則標準誤:,10-1,如果總體標準差未知,則標準誤:,10-2,無論總體標準差已知還是未知,標準誤的大小取決于總體的變異與樣本大小。,標準誤=,=50 =2,總體中個體分數(shù),小樣本,大樣本,10.2 統(tǒng)計假設(shè)檢驗:已知總體均數(shù)和標準差,圖a, 知總體和,從中抽取大量樣本,見圖b,圖b,可以描述這些大量樣本的平均數(shù)和標準差,可用來確定正態(tài)曲線下的概率值。,圖c ,通過已知正態(tài)分

3、布的概率關(guān)系,可計算任意一個樣本的平均數(shù)有關(guān)的概率,10.2.1 樣本平均數(shù)落在特定區(qū)間的概率,如前述,任一正態(tài)變量都可轉(zhuǎn)化為標準正態(tài)分布,可根據(jù) z 分數(shù)與正態(tài)曲線下的面積關(guān)系求概率,換言之,任給一個原始分數(shù),只要知道該分數(shù)之外的面積比例,就可以知道與此相應(yīng)的 z 值。,同理,任給一個樣本平均數(shù),只要知道該平均數(shù)之外的面積比例,就可以知道與此相應(yīng)的 z 值,=2/2=1,P(z1)=0.1587,例2:已知=50,=10,從該總體隨機抽取一個N=25的樣本,問該 52的概率為多少?,P(48X52)=P(-1z1)=20.34=68%,10.2.2 樣本平均數(shù)的假設(shè)檢驗,例3 :一所學(xué)校對四

4、個班的教學(xué)進行為期一年的計算機閱讀教學(xué)。已知測驗的常模為=250,=50,一年后進行測驗,從四個班隨機抽查100人, =263,試問傳統(tǒng)教學(xué)與計算機教學(xué)有無差異?,1. H0:=0=250 ,,2. H1:250,3. 統(tǒng)計檢驗:因為已知,所以使用 z 檢驗,4. 顯著性水平:=0.01 雙尾,5. 抽樣分布:正態(tài)概率曲線,6. 拒絕H0的臨界區(qū)間:| z |2.58,因為|z|2.58, 所以P0.01,拒絕H0,差異有統(tǒng)計學(xué)意義。所在四個班級平均分不同于250分的總體。犯錯誤的風(fēng)險為0.01。,例3 :一所學(xué)校對四個班的教學(xué)進行為期一年的計算機閱讀教學(xué)。已知測驗的常模為=250,=50,一

5、年后進行測驗,從四個班隨機抽查100人, =263,試問傳統(tǒng)教學(xué)與計算機教學(xué)有無差異?,10.3 通過樣本數(shù)據(jù)進行參數(shù)估計點估計,人口普查中的資料可以獲得總體信息,多數(shù)情況不能獲得總體信息,盡管如此,我們?nèi)匀豢梢圆捎脴颖窘y(tǒng)計量推測總體參數(shù)。,實際工作中是抽取單一樣本,利用樣本統(tǒng)計量對總體進行的估計稱為點估計。,已知方差,用方差描述樣本的變異有沒有問題?,沒有問題,再問:用方差估計總體方差有沒有問題?,答:有問題,一般地,樣本方差估計總體方差是偏低的。,如果用大樣本估計總體方差,得到的是無偏估計:,2的無偏估計:,10-4,的無偏估計:,10-5,因此,平均數(shù)抽樣分布的總體方差估計值:,10-6

6、,平均數(shù)抽樣分布的標準誤:,10-7,或者,如果選擇有偏S2 而非無偏估計,常常采用:,10-8,行為科學(xué)常常采用公式10-8 ,我們遵循這一公式,表10-1 溫習(xí)平均數(shù)、方差和標準差的符號,S,標準差,S2,2,2,方差, ,0,平均數(shù),樣本統(tǒng)計量 (經(jīng)驗上的),總體參數(shù) (理論上的),平均數(shù)抽樣分布的無偏總體估計 (經(jīng)驗上的),平均數(shù)的抽樣分布參數(shù) (理論上的),圖10-6 樣本數(shù)據(jù)可以用來估計總體方差(2)的無偏估計 以及平均數(shù)的標準誤 ,樣本方差越大,總體方差的估計值和平均數(shù)的估計標準誤也越大,樣本數(shù)據(jù),或,10.4 參數(shù)未知時統(tǒng)計假設(shè)檢驗 t 檢驗,如果總體方差已知,用,如果總體方差

7、未知,用,圖10-7 當自由度=3,10和時,t 分布于標準正態(tài)分布的比較,注:自由度是指對一組數(shù)據(jù)進行一定的控制之后,可以自由變化的數(shù)據(jù)個數(shù)。,假設(shè)有四個數(shù):18、23、27、32 ,和是多少?平均數(shù)是多少?,這四個數(shù)的和是100,平均數(shù)是 =25,(1825)+(2325)+(2725)+(3225)=(7)+( 2)+2+7=0,如果必須根據(jù)平均數(shù)計算離差,那么只有第四個固定,其他三個可以自由變化。自由度f=4-1=3,推而廣之:任意一個樣本,我們對它只有一個限制條件,那么這個樣本的自由度就是N-1,今后我們使用 t 分布進行各種檢驗,會用各種不同的自由度。,需要說明的是,t 檢驗是一種

8、穩(wěn)健的檢驗,這就意味著即使總體分布嚴重偏離正態(tài)分布,t 檢驗的統(tǒng)計推論也是相當有效的,這個結(jié)論是由中心極限定理決定的。我們我們懷疑分布是否符合正態(tài)性,明智的做法是增加樣本量。,10.4.1 t 分布的特點,t 分布與標準正態(tài)分布一樣,關(guān)于平均數(shù)0對稱。,t 分布的離散程度比正態(tài)分布大,見圖10.8 當未知時,用 z 檢驗代替 t 檢驗,會冒很大的風(fēng)險去拒絕一個真實的虛無假設(shè),所以犯類錯誤的危險非常大。增大 t 值可以界定出拒絕區(qū)域,臨界值為3.182。0.05的拒絕區(qū)域:| t | 3.182,t 分布的臨界值表,與正態(tài)分布不同, t 分布的臨界值(critical value)是指與各種顯著

9、性水平相對應(yīng)的臨界值區(qū)域的對應(yīng)值。查表時,先找到df=3,按雙尾=0.05往下找到臨界值 t =3.182。一旦 算的的 t 值大于3.182,就拒絕H0.,10.4.2 未知時的統(tǒng)計假設(shè)檢驗:單樣本情況,例4 :一所學(xué)校對全校教學(xué)進行測驗。如果測驗的分數(shù)低于250,可獲得政府部門的撥款,從全校隨機隨機抽查10人進行測驗,結(jié)果 =243.3,標準差S=5.1,試問全校平均分與250有無差異?能否獲得撥款?,1. H0:=0=250,2. H0:250,3. 統(tǒng)計檢驗:因為未知,所以使用 t 檢驗,4. 顯著性水平:=0.05 ,雙尾,5. 抽樣分布:自由度df=10-1=9的 t 分布,6.

10、拒絕H0的臨界區(qū)間:| t |2.262,因為 t =3.94,| t |2.262 ,所以拒絕虛無假設(shè),按照=0.05雙尾的顯著性水平差別有統(tǒng)計學(xué)意義,可以認為該校測驗平均分數(shù)低于250??梢垣@得政府撥款。,10.5 參數(shù)估計:區(qū)間估計,除了點估計。推論統(tǒng)計還包括區(qū)間估計。,區(qū)間估計(interval estimation) 是指包括總體真值的范圍所作的估計。,例5:成都電視臺8月初報道有1名13歲的肥胖兒童名叫浩浩的,體重達到230斤,假如你不知道他的真實體重,你憑什么猜測他的體重呢?你有多大把握說他的體重是230斤呢?,一般是通過觀察,憑借印象猜測他是200斤,這個就叫“點估計”,如果猜

11、測體重大約在200240斤,就稱為區(qū)間估計。,10.6 置信區(qū)間與置信限,總體均數(shù)真值落入的區(qū)間,就稱為置信區(qū)間。(confidence interval ),置信界限稱為置信限(confidence limit),=0.05的置信區(qū)間稱為95%的置信區(qū)間。=0.01的置信區(qū)間稱為99%的置信區(qū)間。,例5 在例4中,已知 ,N=10, 計算總體測驗分數(shù)95%的置信區(qū)間。,所以0 的下限=,=243.32.2621.7,=243.3 3.85=239.45,上限=243.3+3.85=247.15,解釋置信區(qū)間需注意的問題:,在計算總體均數(shù)可能落入的區(qū)間時,我們不知道計算的樣本平均數(shù)正確的概率有

12、多大,也就不能夠確定總體均數(shù)為的概率是95%還是99%。我們計算的概率不是針對總體均數(shù),而是針對區(qū)間內(nèi)包含總體均數(shù)的概率。,從總體中重復(fù)抽取100個樣本,理論上有95的區(qū)間包含總體均數(shù),大約有5個不包含。,這里的 C 表示總體均數(shù)的置信區(qū)間,而非概率,10.7 Pearson 相關(guān)系數(shù) r 的檢驗:單個樣本,回憶下,相關(guān)系數(shù)在什么范圍?,| r |1,r=1,完全相關(guān), r=0,不相關(guān),對于單個樣本,假設(shè)H0:=0,圖10-9, =-0.8, =0, =+0.8 相關(guān)系數(shù)的抽樣分布,10.7.1 總體相關(guān)系數(shù)=0時的假設(shè)檢驗,10-11,df=N2 ,為什么?,例6 社會心理學(xué)家編制了一份測量

13、人們是否服從權(quán)威的量表,對15名被試進行了測試,其得分與另外一個對少數(shù)群體歧視的調(diào)查量表得分相關(guān)。兩組得分的相關(guān)系數(shù) r =0.6,即對權(quán)威服從的得分越高,對少數(shù)群體的歧視就越厲害,這個相關(guān)系數(shù)是否來自于=0的總體呢?,1. H0: 0,2. H0: 0,3. 統(tǒng)計檢驗:自由度=N-2,使用 t 檢驗,4. 顯著性水平:=0.05 ,單尾檢驗,5. 抽樣分布:自由度df=152=13的 t 分布,6. 拒絕H0的臨界區(qū)間: t 0.051.771 ,如果t1.771,拒絕H0。,因為t1.771,它落入了拒絕H0的臨界區(qū)間,所以拒絕H0,這兩個得分的總體相關(guān)系數(shù)大于零。,10.7.2 等級相關(guān)

14、系數(shù) rS 的假設(shè)檢驗:單樣本,問題:假如你是一名教師,你對“智力與領(lǐng)導(dǎo)力是相關(guān)變量”抱有質(zhì)疑,沒有適當?shù)亩攘繙y量領(lǐng)導(dǎo)力,但是可以對領(lǐng)導(dǎo)力加以排序,從而組成順序量表如下。,試問:r=0.64的相關(guān)系數(shù)是否是顯著的?,因為 r=0.640.521,拒絕H0,智力水平與領(lǐng)導(dǎo)角色顯著相關(guān)。,統(tǒng)計表的來源:*Reporduced with kind permission from S. Kokoska and D.Zwillinger. 1999. Probabillity and Statistics Tables and Formulae,Chapman & Hall/CRC,Boca Raton

15、,Florida,188.,查Spearman秩相關(guān)系數(shù) rs 的臨界值表,注意:有些表沒有N=15的r,用內(nèi)插法, (0.538+0.503)/2=0.521,10.8 案例,2. H0:100,3. 統(tǒng)計檢驗:因為已知,所以使用 z 檢驗,4. 顯著性水平:=0.01, 雙尾,5. 抽樣分布:正態(tài) 分布,6. 拒絕H0的臨界區(qū)間:| z |2.58,1. H0:=100,某公司欲招聘幾百名裝配工去組裝高精度儀器的小型部件,這個工作要求手眼協(xié)調(diào)能力高。在例行體檢中,發(fā)現(xiàn)有30名服用了大麻。于是對這30名進行一種手的靈敏度測驗,已知測驗常模為=100,=15,應(yīng)聘者 =92,S=10.,因為z

16、=2.922.58,P 0.05 , 按雙尾=0.05,拒絕H0,這30名體檢陽性者應(yīng)聘成績不如更大總體中隨機抽取的樣本中的期望成績。,注意:這個檢查結(jié)果雖然支持了你的懷疑,但是實驗設(shè)計并不嚴密,該研究沒有設(shè)置對照組,也沒有對被試者進行隨機分配。這些人是公司挑選的,這個結(jié)果也可能是出于另外的原因致使其操作水平與預(yù)期水平有顯著差異。,計算置信區(qū)間:,置信區(qū)間下限:922.4051.86=88.20,置信區(qū)間上限:922.4051.86=95.80,于是95%的置信區(qū)間為(88.20 , 95.80),繼續(xù)研究,30人的手測試得分與對大麻的依賴程度,計算Pearson 相關(guān)系數(shù),r=0.62。,H0:=0,df=30-2=28,t =4.180 2.763 , 按照雙尾0.01水平,拒絕H0。,小結(jié),1. 樣本平均數(shù)的分布服從正態(tài)分布。,從總體中抽取一個大樣本,2. 平均數(shù)抽樣分布的總體平均數(shù)等于總體平均數(shù),3. 平均數(shù)的標準誤等于總體標準差除以樣本量的平方根。即:,4. 如

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論