統(tǒng)計推斷PPT課件_第1頁
統(tǒng)計推斷PPT課件_第2頁
統(tǒng)計推斷PPT課件_第3頁
統(tǒng)計推斷PPT課件_第4頁
統(tǒng)計推斷PPT課件_第5頁
已閱讀5頁,還剩120頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

.1,statisticalinference)。2,統(tǒng)計推斷,從一個或一系列樣本的結(jié)果推斷總體特征,假設(shè)檢驗,參數(shù)估計。3,第一節(jié),第二節(jié),第三節(jié),第四節(jié),第五節(jié),假設(shè)檢驗的原理和方法,樣本平均值的假設(shè)檢驗,樣本頻率的假設(shè)檢驗,參數(shù)的區(qū)間估計和點估計,方差的同質(zhì)性檢驗。4,第1節(jié),抵押權(quán)的原則和方法。5,一個概念:假設(shè)檢驗,也稱為顯著性檢驗,是根據(jù)總體的理論分布和小概率原理,對未知或不完全已知的總體提出兩個相反的假設(shè),然后根據(jù)樣本的實際原理,經(jīng)過一定的計算,做出在一定概率意義上應(yīng)該被接受的假設(shè)的推論。假設(shè)檢驗,小概率原理,在抽樣檢驗中,概率很小的事件幾乎不可能發(fā)生。=0.05/0.01。如果假設(shè)某些條件,并且在假設(shè)條件非常小的情況下,事件A發(fā)生的概率可以精確計算,則事件A將在假設(shè)條件下的N次獨立重復(fù)測試中按照預(yù)定的概率發(fā)生,而在一次測試中幾乎不可能發(fā)生。統(tǒng)計假設(shè)檢驗的基本思想是,一個地區(qū)的地方小麥品種一般每667m2產(chǎn)量為300公斤,即群體中地方品種的平均數(shù)量為0=300(公斤),方差2=(75)2公斤由多年種植結(jié)果得到。如果從這個群體中隨機選擇n個個體形成一個樣本,樣本的觀察值可以表示為:yi=01(I=1,2,n)。通過在25個地區(qū)的試驗,新品種樣品的平均產(chǎn)量為330公斤/667平方米。新品種的樣本觀測值可表示為:Xi= I (I=1,2,n),其中是新品種的總體平均值。新品種和本地品種之間的差異(品種效應(yīng))用表示,然后=- 0,9,代入上式:xi= 0 i (I=1,2,n)對Xi進(jìn)行平均,并將公式略微變形為:- 0=,這是一種表型效應(yīng)。在本例中,10、由于加工效應(yīng)=- 0無法計算,統(tǒng)計推斷只能從第二種可能性開始,即假設(shè)加工效應(yīng)不存在,實驗表型效應(yīng)全是實驗誤差。(1)加工效應(yīng)和誤差效應(yīng);(2)都是測試錯誤。我們可以看到表型效應(yīng)的形成有兩種可能性,然后我們可以計算假設(shè)出現(xiàn)的概率,最后我們可以根據(jù)概率的大小判斷假設(shè)是否真實,從而我們可以推斷加工效應(yīng)是否存在(反證法)。這是統(tǒng)計假設(shè)檢驗的基本思想。11,2,假設(shè)檢驗步驟,治療前0=1262=240,n (126,240),治療后n=6x=136未知則=0?喹硫平治療矽肺有效嗎?矽肺患者的血紅蛋白含量假定為正態(tài)分布,平均值為0=126 (mg/l)和2=240 (mg/l) 2。六名矽肺病患者目前正在接受喹硫平治療。治療后,通過實驗室試驗確定平均血紅蛋白含量x=136(毫克/升)。提出假設(shè)無效假設(shè)/零假設(shè)/檢驗假設(shè)替代假設(shè)/對應(yīng)假設(shè)0=,0誤差效應(yīng)治療效應(yīng)H0,哈,例13:喹硫平能提高矽肺患者的血紅蛋白含量嗎?檢查治療后的總體平均值是否為治療前的126(毫克/升)?在這種情況下,零假設(shè)意味著治療后的平均血紅蛋白仍與治療前相同,并且兩者來自同一人群。接受零假設(shè)意味著奎硫平?jīng)]有療效。然而,另一個相反的假設(shè)表明拒絕H0。治療后的平均血紅蛋白和治療前的平均血紅蛋白來自不同人群,即喹硫平有效。h 0:= 0=126 (mg/l),ha 3336 0。14,2,確定顯著性水平,=0.05,顯著性水平*,極顯著性水平* *,可以否定H0的人為規(guī)定的概率標(biāo)準(zhǔn)稱為顯著性水平,其記錄為。在統(tǒng)計學(xué)中,一般認(rèn)為概率小于0.05或0.01的事件是小概率事件,因此基于小概率原則建立的假設(shè)檢驗通常取=0.05和=0.01的兩個顯著水平。P 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96,p 1.96 和,和,和,和,和,和,和,和,和,和,和,和,和當(dāng)P30時,樣本方差s2可以用來代替總體方差2,并且仍然使用U檢驗方法。例如,在某一紡織品的生產(chǎn)中,要求棉花的平均纖維長度大于30毫米。對于現(xiàn)有的棉花品種,隨機檢查n=400,平均纖維長度確定為30.2毫米,標(biāo)準(zhǔn)偏差為2.5毫米。問題是棉花品種的纖維長度是否滿足紡織品的生產(chǎn)要求。分析,(1)這是一個假設(shè)檢驗的樣本平均值,因為總體2是未知的,n=40030,s2可以用來代替2進(jìn)行U檢驗;(2)只有30毫米棉纖維符合紡織品的生產(chǎn)要求,因此進(jìn)行單端檢驗。(1)假設(shè),(2)水平,(3)檢驗,(4)推論,H0:0=30(cm),即棉花品種的纖維長度不能滿足紡織生產(chǎn)的要求。HA : 0,選擇有效水平=0.05,U 0.05,41,3,種群方差 2未知,當(dāng)n30時,樣本方差s2可以用來代替種群方差2,使用T檢驗方法df=n-1,種群( 0),S2,2,42,例如:魚塘水中的含氧量,多年平均為4.5(mg/L),魚塘配備10個點來采集水樣。測得的氧含量為4.33、4.62、3.89、4.14、4.78、4.64、4.52、4.55、4.48和4.26(毫克/升)。試著檢查這次取樣測量的水中氧含量與多年平均值之間是否有顯著差異。分析,(1)這是樣本平均值的假設(shè)檢驗,因為總體2未知,n=10或0.05,44,2,假設(shè)檢驗的兩個樣本平均值,假設(shè)檢驗的樣本平均值,45,適用范圍:測試兩個樣本平均值x1和x2所屬的總體平均值1和2是否來自同一總體。兩個樣本平均數(shù)的假設(shè)檢驗程序如下:1 .提出假設(shè),無效假設(shè)H0:1=2,并且兩個平均值之間的差異是由隨機誤差引起的。另一種假設(shè)是,HA:1=2,兩個平均值之間的差值不僅包括隨機誤差,還包括其實際差值,即由效應(yīng)差引起的差值。47,2,確定顯著性水平:0.05或0.01,3,檢驗統(tǒng)計量,(1)樣本平均值之差=總體平均值之差。兩個樣本平均值的差值,48,(2)樣本平均差的方差=兩個樣本平均方差之和,樣本平均差的標(biāo)準(zhǔn)誤差,49,12=22=,n1=n2=n,12=22=n1=n2=n。50,當(dāng)12和22已知時,h0: 1= 2=。51,當(dāng)12和22未知時,兩個樣本都是大樣本,h0: 1= 2=。52,當(dāng)12和22未知時,兩個樣本都是小樣本,h0: 1= 2=。53,4,演繹和解釋、54,實驗設(shè)計,分組數(shù)據(jù)的平均數(shù)量的比較,配對數(shù)據(jù)的平均數(shù)量的比較,55,以及分組數(shù)據(jù)的平均數(shù)量的比較。如果兩個樣本的變量是從它們各自的總體中隨機選擇的,并且兩個樣本之間的變量不相關(guān),即兩個樣本彼此獨立,則無論兩個樣本是否具有相同的容量,所獲得的數(shù)據(jù)都是分組數(shù)據(jù)。兩組的數(shù)據(jù)通過組平均值相互比較,以檢驗差異的顯著性。根據(jù)兩個樣本所屬的總體方差是否已知以及樣本大小是否不同,采用不同的檢驗方法。嘿。嘿。56,1,兩個總體方差12和22是已知的,或者12和22是未知的,但是兩個樣本都是大樣本,即n130和n230,使用U檢驗方法。雜交黑麥從播種到開花的天數(shù)的標(biāo)準(zhǔn)偏差為6.9 d。方法a:調(diào)查400株植物,平均為69.5,試比較兩種調(diào)查方法對黑麥從播種到開花的天數(shù)沒有顯著差異。(1)假設(shè),(2)水平,(3)檢驗,(4)推斷,H 0: 1= 2,即兩種方法得到的天數(shù)相同。選擇顯著水平=0.05,在顯著水平0.05,接受H0,拒絕透明質(zhì)酸;據(jù)信,通過這兩種方法獲得的黑麥從播種到開花的天數(shù)沒有顯著差異。為了比較“42-67603”和“42-67PB86”的出膠率,隨機抽取55個和107個橡膠品系進(jìn)行出膠,平均出膠率分別為95.4毫升/品系和77.6毫升/品系。橡膠產(chǎn)量的方差分別為936.36(ml/株)2和800.89(ml/株)2。分析,(1)這是比較兩個樣本(分組數(shù)據(jù))平均值的假設(shè)檢驗。12和22是未知的,n230和n22是未知的。(2)采用雙尾檢驗是因為兩個品種的產(chǎn)量事先不知道。嘗試檢查兩個橡膠品種的出膠量是否有顯著差異。(1)假設(shè),(2)水平,(3)檢驗,(4)推斷,H 0: 1= 2,即兩個品種的出鋼率無顯著差異。選擇有效水平=0.01,在有效水平0.01,拒絕H0并接受高可用性;“42-67XLM 603”的橡膠產(chǎn)量明顯高于“42-67PB 86”。嘿。嘿。60,2,兩個總體方差12和22未知,并且兩個樣本都是小樣本,即n130和N20.05,DF=(N1-1) (N2-1)=17,66,2) 12 22,n1n2,采用近似T檢驗,即Aspin-Welch檢驗法。67,(3)1222,n1=n2=n,se2,2,df=n-1,均值差的標(biāo)準(zhǔn)誤差,當(dāng)n1=N2=n,68,配對數(shù)據(jù)的平均值的比較,配對(配對)比較方法:將幾個獨立獲得的實驗材料分成兩部分或幾對獨立獲得的遺傳上基本相同的個體,分別接受兩種不同的處理;或者同一受試者連續(xù)接受兩種不同的治療并比較不同的治療效果。這種安排被稱為配對實驗設(shè)計。對于成對數(shù)據(jù),由于同一對中的兩個測試單元的測試條件非常接近,不同對之間的條件差異可以通過同一對的差異來消除,測試誤差可以控制,準(zhǔn)確度高。69,x1,x2,樣本1,樣本2,n對,樣本差異的平均數(shù)等于樣本差異的平均數(shù)。70,h0: d=0,df=n-1,樣本差異方差,樣本差異平均數(shù)的標(biāo)準(zhǔn)誤差,t值,例如,在研究飲食中缺乏ve和肝臟中va之間的關(guān)系時,根據(jù)性別、體重等將試驗動物分成8對。用隨機分配法將每對試驗動物分為正常飼料組和VE缺乏組。然后殺死試驗動物并測定其肝臟中的VA含量。結(jié)果如右表所示:組差DD 213550245100121000022002400-40016000030018001200144000439007 5056205 0538003 2505006 3750006 32005 320005 32006 320005 320005 4 200004 20004 200005 4 2000005 4 20000005 4 20000005 4 00000005這是一對數(shù)據(jù)。我事先不知道兩組飼料中哪一組更重要或更不重要。我用兩條尾巴。72,(1)假設(shè),(2)水平,(3)測試,h 0: d=0ha : d 0,=0.01,(4)推斷,在0.01的顯著水平,拒絕h 0并接受ha;兩組飼料對動物肝臟中VA含量的影響有非常顯著的差異。正常飼料組的維生素a含量顯著高于維生素e缺乏組。,t0.01 (7)=3.499 t0.01 (7),已知,73,第3節(jié),樣本頻率的假設(shè)檢驗,74,二項式分布,頻率分布,二項式組成,目標(biāo)屬性。75,假設(shè)檢驗的頻率,當(dāng)np或nq30,中心極限定理,正態(tài)分布(U檢驗),近似值,77,假設(shè)檢驗的頻率,當(dāng)51.96,P30時,不需要連續(xù)修正,用U檢驗:下H0:p1=p2,2,下H0:p1=p2,用U檢驗:下H 0: p1=P2,89,2,下H 0: p1=P2,P0.01,93,1。參數(shù)區(qū)間估計和點估計的原理,三兩個總體平均數(shù)之間差異的區(qū)間估計和點估計,2。人口平均數(shù)的區(qū)間估計和點估計。群體頻率的區(qū)間估計和點估計、兩個群體頻率數(shù)之間的差異以及參數(shù)的區(qū)間估計和點估計是基于一定理論的方法。根據(jù)中心極限定理和大數(shù)定律,只要樣本是大樣本,無論總體是否服從正態(tài)分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論