第四章環(huán)境參數(shù)的統(tǒng)計推斷課件_第1頁
第四章環(huán)境參數(shù)的統(tǒng)計推斷課件_第2頁
第四章環(huán)境參數(shù)的統(tǒng)計推斷課件_第3頁
第四章環(huán)境參數(shù)的統(tǒng)計推斷課件_第4頁
第四章環(huán)境參數(shù)的統(tǒng)計推斷課件_第5頁
已閱讀5頁,還剩315頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

環(huán)境參數(shù)的統(tǒng)計推斷(statisticalinference)第四章環(huán)境參數(shù)的統(tǒng)計推斷(statisticalinferenc第四章環(huán)境參數(shù)的統(tǒng)計推斷統(tǒng)計推斷由一個樣本或一糸列樣本所得的結(jié)果來推斷總體的特征假設檢驗參數(shù)估計第四章環(huán)境參數(shù)的統(tǒng)計推斷統(tǒng)由一個樣假設檢驗參數(shù)估計第四章第一節(jié)第二節(jié)第三節(jié)第四節(jié)第五節(jié)假設檢驗的原理與方法樣本平均數(shù)的假設檢驗樣本頻率的假設檢驗參數(shù)的區(qū)間估計與點估計方差的同質(zhì)性檢驗第四章第一節(jié)第二節(jié)第三節(jié)第四節(jié)第五節(jié)假設檢驗的原理與方法樣本第一節(jié)假設檢驗的原理與方法第一節(jié)假設檢驗的原理與方法一概念:

假設檢驗(hypothesistest)又稱顯著性檢驗(significancetest),就是根據(jù)總體的理論分布和小概率原理,對未知或不完全知道的總體提出兩種彼此對立的假設,然后由樣本的實際結(jié)果,經(jīng)過一定的計算,作出在一定概率意義上應該接受的那種假設的推斷。第一節(jié)假設檢驗一概念:第一節(jié)假設檢驗小概率原理

概率很小的事件在一次抽樣試驗中實際是幾乎不可能發(fā)生的。=0.05/0.01

如果假設一些條件,并在假設的條件下能夠準確地算出事件A出現(xiàn)的概率α為很小,則在假設條件下的n次獨立重復試驗中,事件A將按預定的概率發(fā)生,而在一次試驗中則幾乎不可能發(fā)生。小概率原理概率很小的事件在一次抽樣試驗=假設檢驗參數(shù)檢驗非參數(shù)檢驗平均數(shù)的檢驗頻率的檢驗方差的檢驗秩和檢驗符號檢驗游程檢驗秩相關檢驗假參數(shù)檢驗非參數(shù)檢驗平均數(shù)的檢驗頻率的檢驗方差的檢驗秩和檢驗二、假設檢驗的步驟

治療前0

=126

2=240

N(126,240)治療后n=6x=136未知那么=0?

即克矽平對治療矽肺是否有效?例:設矽肺病患者的血紅蛋白含量具平均數(shù)0=126(mg/L),

2=240

(mg/L)2的正態(tài)分布。現(xiàn)用克矽平對6位矽肺病患者進行治療,治療后化驗測得其平均血紅蛋白含量x=136(mg/L)。二、假設檢驗的步驟治療前0=126N1、提出假設對立無效假設/零假設/檢驗假設備擇假設/對應假設0

0

誤差效應處理效應H0HA1、提出假設對無效假設備擇假設0=0例:克矽平治療矽肺病是否能提高血紅蛋白含量?平均數(shù)的假設檢驗檢驗治療后的總體平均數(shù)是否還是治療前的126(mg/L)?x-0=136-126=10(mg/L)這一差數(shù)是由于治療造成的,還是抽樣誤差所致。本例中零假設是指治療后的血紅蛋白平均數(shù)仍和治療前一樣,二者來自同一總體,接受零假設則表示克矽平?jīng)]有療效。而相對立的備擇假設表示拒絕H0,治療后的血紅蛋白平均數(shù)和治療前的平均數(shù)來自不同總體,即克矽平有療效。H0:μ=μ0=126(mg/L)HA:μ≠μ0

例:克矽平治療矽肺病是否能提高血紅蛋白含量?平均數(shù)的假設檢驗2、確定顯著水平=0.05顯著水平*極顯著水平**能否定H0的人為規(guī)定的概率標準稱為顯著水平,記作。

統(tǒng)計學中,一般認為概率小于0.05或0.01的事件為小概率事件,所以在小概率原理基礎上建立的假設檢驗也常取=0.05和=0.01兩個顯著水平

。P<=0.01=0.052、確定顯著水平=0.05顯著水平*極顯著水平**能否3、選定檢驗方法,計算檢驗統(tǒng)計量,確定概率值u=x-

x

136-126=√40=1.581P(u>1.581)=2×0.0571=0.1142

根據(jù)研究設計的類型和統(tǒng)計推斷的目的選擇使用不同的檢驗方法。例:3、選定檢驗方法,計算檢驗統(tǒng)計量,確定概率值u=x-4、作出推斷結(jié)論:是否接受假設P>P<小概率原理接受H0否定HA否定H0接受HA可能正確可能錯誤4、作出推斷結(jié)論:是否接受假設P>P<小接受H0否定H例:上例中

P=0.1142>0.05所以接受H0,從而得出結(jié)論:使用克矽平治療前后血紅蛋白含量未發(fā)現(xiàn)有顯著差異,其差值10應歸于誤差所致。例:上例中P(u>1.96)=0.05P(u>2.58)=0.01已知:0.950.0250.025u>1.96u>2.58P(u)<0.05P(u)<0.01差異達顯著水平差異達極顯著水平P(u>1.96)=0.05P(u>2.50P(-1.96x<x<

+1.96x)=0.95-1.96x+1.96x0.950.0250.025臨界值:+ux左尾右尾否定區(qū)否定區(qū)接受區(qū)u+1.96x三、雙尾檢驗與單尾檢驗0P(-1.96x<x<+1.96x)=00P(-2.58x<x<

+2.58x)=0.99-2.58x+2.58x0.990.0050.005臨界值:+2.58x左尾右尾雙尾檢驗(two-sidedtest)否定區(qū)否定區(qū)接受區(qū)0P(-2.58x<x<+2.58x)=00.950.950.050.051.64-1.64H0

:≤0HA

:>0假設:否定區(qū)H0

:≥0HA

:<0左尾檢驗右尾檢驗單尾檢驗(one-sidedtest)接受區(qū)接受區(qū)0.950.950.050.051.64-1.64H0:u0.05=1.64u0.01=2.33單尾檢驗分位數(shù)雙尾檢驗分位數(shù)u0.05/2=1.96u0.01/2=2.5822否定區(qū)否定區(qū)否定區(qū)接受區(qū)接受區(qū)查表時,單尾概率等于雙尾概率乘以2>u0.05=1.64單尾雙尾u0.05/2=1.96四、兩類錯誤假設檢驗的兩類錯誤

H0正確

H0錯誤否定H0

錯誤()推斷正確(1-)接受H0

推斷正確(1-)

錯誤()第一類錯誤(typeIerror),又稱棄真錯誤或錯誤;第二類錯誤(typeII

error

),又稱納偽錯誤或錯誤四、兩類錯誤假設檢驗的兩類錯誤第一類錯誤(typeIe0ⅠⅡ0.025Ⅰ和Ⅱ重合=

00.950.025錯誤犯第一類錯誤的概率等于顯著水平值0ⅠⅡ0.025Ⅰ和Ⅱ重合=00.950.02ⅠⅡC1C2220u-uⅠ和Ⅱ不重合犯第二類錯誤的概率記為值ⅠⅡC1C2220u-uⅠ和Ⅱ不重合犯1、兩類錯誤既有聯(lián)系又有區(qū)別

錯誤只在否定H0時發(fā)生

錯誤只在接受H0時發(fā)生錯誤增加錯誤減小錯誤增加錯誤減小結(jié)論1、兩類錯誤既有聯(lián)系又有區(qū)別錯誤只在否定H0時發(fā)生2、還依賴于-0的距離結(jié)論3、n,

2可使兩類錯誤的概率都減小.2、還依賴于-0的距離結(jié)論3、n,2可單尾檢驗左尾檢驗右尾檢驗0.950.950.050.051.64-1.64否定區(qū)接受區(qū)接受區(qū)否定區(qū)只在一側(cè)單尾檢驗左尾檢驗右尾檢驗0.950.950.050.051.分析題意提出假設確定顯著水平計算檢驗統(tǒng)計量作出推斷

假設檢驗的步驟:分提確計作假設檢驗的步驟:第二節(jié)樣本平均數(shù)的假設檢驗第二節(jié)樣本平均數(shù)的假設檢驗大樣本平均數(shù)的假設檢驗--u檢驗小樣本平均數(shù)的假設檢驗--t檢驗單樣本雙樣本大樣本平均數(shù)的假設檢驗小樣本平均數(shù)的假設檢驗單樣本雙樣本一、一個樣本平均數(shù)的假設檢驗樣本平均數(shù)的假設檢驗一、一個樣本平均數(shù)樣本平均數(shù)的假設檢驗適用范圍:檢驗某一樣本平均數(shù)x所屬的總體平均數(shù)是否和某一指定的總體平均數(shù)0相同。若相同,則說明該樣本屬于這個以0為平均數(shù)的指定總體;若不相同,則說明該樣本所屬的總體與這個指定總體(0

)不同,即有顯著或極顯著差異。適用范圍:檢驗某一樣本平均數(shù)x所屬的總體平均數(shù)是否和某一指1、總體方差σ2已知,無論n是否大于30都可采用u檢驗法這里所要講的內(nèi)容在前面已經(jīng)講過了,這里只是簡單地做個小結(jié),給出檢驗的基本程序,并舉出例子說明檢驗過程。檢驗的基本程序如下:1)假設從σ已知的正態(tài)總體,或近似正態(tài)總體中,隨機抽取含量為的n樣本。1、總體方差σ2已知,無論n是否大于30都可采用u檢驗法這里2)零假設

H0:m=m0。備擇假設可有以下三種情況:

(1)HA:μ>μ0

,若已知μ不可能小于μ0

。

(2)HA:μ<μ0

,若已知μ不可能大于μ0

。

(3)HA:μ≠μ0

,包括μ>μ0

和μ<μ0

3)在a=0.05水平上,拒絕H0稱為“差異顯著”。在a=0.01水平上,拒絕H0稱為“差異極其顯著”。4)

檢驗的統(tǒng)計量:2)零假設H0:m=m0。5)

相應于2)中的3個備擇假設的H0的拒絕域分別為:

(1)u>u

a

(2)u<-u

a

(3)│u│>u

a/2,或表示為│u│>u

a(雙側(cè))正態(tài)分布的分位數(shù),可以從附表中查出。6)根據(jù)以上所做的分析,進行統(tǒng)計推斷,得出結(jié)論。5)相應于2)中的3個備擇假設的H0的拒絕域分別為:例:已知某工廠排污水中石油分布屬正態(tài)分布N(45,2.12),現(xiàn)經(jīng)過水樣處理,隨機采樣8次,得樣本平均值為42.5ppm,樣本標準差為2.1。問經(jīng)過處理后水質(zhì)含油量是否有明顯降低。分析(1)這是一個樣本平均數(shù)的假設檢驗,因總體σ2已知,采用u檢驗;(2)處理后水質(zhì)含油量是否降低,只需作進行單尾檢驗即可。例:已知某工廠排污水中石油分布屬正態(tài)分布N(45,2.12)(1)假設(2)水平(3)檢驗(4)推斷H0:μ=μ0=45(ppm),即處理前后水質(zhì)含油量保持不變;HA:μ<μ0選取顯著水平α=0.05u0.05

=1.645<︱u︱=3.4u落在拒絕域內(nèi),否定H0,接受HA;說明水質(zhì)處理后得到改善。(1)假設(2)水平(3)檢驗(4)推斷H0:μ=μ0=452、總體方差σ2未知,但n>30時,可用樣本方差s2來代替總體方差σ2

,仍用u檢驗法總體(μ0)樣本(n>30)xs2σ22、總體方差σ2未知,但n>30時,可用樣本方差s2來代替總例:抽取某地區(qū)糧食樣品36個,測得糧食中六六六的平均值為0.325mg/kg,標準差為0.068mg/kg,國家食品衛(wèi)生標準規(guī)定,糧食中六六六殘留量<0.3mg/kg。問該地區(qū)糧食中六六六殘留量是否超標?分析(1)這是一個樣本平均數(shù)的假設檢驗,因總體σ2未知,n=36>30,可用s2代替σ2進行u檢驗;(2)該地區(qū)糧食中六六六殘留量<0.3mg/kg才符合食品衛(wèi)生標準,因此進行單尾檢驗。例:抽取某地區(qū)糧食樣品36個,測得糧食中六六六的平均值為0.(1)假設(2)水平(3)檢驗(4)推斷H0:μ≤μ0=0.3mg/kg,即該地區(qū)糧食中六六六殘留量符合食品衛(wèi)生標準。HA:μ>μ0選取顯著水平α=0.05u>u0.05=1.645拒絕H0,接受HA;認為該地區(qū)糧食中六六六殘留量超標。(1)假設(2)水平(3)檢驗(4)推斷H0:μ≤μ0=03、總體方差σ2未知,且n<30時,可用樣本方差s2來代替總體方差σ2

,采用df=n-1的t檢驗法總體(μ0)樣本(n<30)x

s2σ23、總體方差σ2未知,且n<30時,可用樣本方差s2來代替總

對于一個正態(tài)總體,若s未知且n<30,則x服從n-1自由度的t

分布。因此,在s未知時可用t檢驗做平均數(shù)的顯著性檢驗。t

檢驗的程序與u檢驗一樣,只要用t分布的分位數(shù)ta代替標準正態(tài)分布的分位數(shù)ua就可以了。t

檢驗的程序這里不再贅述。下面只指出這兩種檢驗的不同點。t檢驗的統(tǒng)計假設是:零假設H0:μ=μ0

。備擇假設有以下三種情況:(1)HA:μ>μ0

,若已知μ不可能小于μ0。(2)HA:μ<μ0

,若已知μ不可能大于μ0。(3)HA:μ≠μ0

,包括μ>μ0

和μ<μ0。

對于一個正態(tài)總體,若s未知且n<檢驗的統(tǒng)計量:

具n-1自由度。不同自由度下t

分布的分位數(shù)見附表。三種備擇假設的拒絕域為:(1)t

>t

a。(2)

t

<-t

a。(3)│t│>t

a(雙側(cè))。檢驗的統(tǒng)計量:具n-1自由度。不同自由度下t例:某魚塘水中的含氧量,多年平均為4.5(mg/L),該魚塘設10個點采集水樣,測定含氧量為:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L)試檢驗該次抽樣測定的水中含氧量與多年平均值有無顯著差別。分析(1)這是一個樣本平均數(shù)的假設檢驗,因總體σ2未知,n=10<30,可用s2代替σ2進行t檢驗;(2)該次測定的水中含氧量可能>或<多年平均值,用雙尾檢驗。例:某魚塘水中的含氧量,多年平均為4.5(mg/L),該魚塘(1)假設(2)水平(3)檢驗(4)推斷H0:μ=μ0=4.5(mg/L),即認為該次測定與多年平均值沒有顯著差別。HA:μ≠μ0選取顯著水平α=0.05在0.05顯著水平上,接受H0,否定HA;認為該次抽樣所測結(jié)果與多年平均值無顯著差別,屬于隨機誤差。︱t︱<t0.05(9)=2.262P>0.05(1)假設(2)水平(3)檢驗(4)推斷H0:μ=μ0=二、兩個樣本平均數(shù)的假設檢驗樣本平均數(shù)的假設檢驗二、兩個樣本平均數(shù)樣本平均數(shù)的假設檢驗適用范圍:檢驗兩個樣本平均數(shù)x1和x2所屬的總體平均數(shù)1和2是否來自同一總體。適用范圍:檢驗兩個樣本平均數(shù)x1和x2所屬的總體平均數(shù)1和樣本1X1樣本2X2總體1μ1

總體2μ2兩個樣本平均數(shù)的假設檢驗步驟1、提出假設無效假設H0:μ1=μ2

,兩個平均數(shù)的差值是隨機誤差所引起的;備擇假設HA:μ1=μ2

,兩個平均數(shù)的差值除隨機誤差外還包含其真實的差異,即由處理引起的.樣本1樣本2總體1總體2兩個樣本平均數(shù)的假設檢驗步驟1、提出2、確定顯著水平:0.05或0.013、檢驗統(tǒng)計量(1)樣本平均數(shù)差數(shù)的平均數(shù)=總體平均數(shù)的差數(shù).兩個樣本平均數(shù)的差數(shù)2、確定顯著水平:0.05或0.013、檢驗統(tǒng)計量(1)樣本(2)樣本平均數(shù)差數(shù)的方差=兩樣本平均數(shù)方差之和.樣本平均數(shù)差數(shù)的標準誤(2)樣本平均數(shù)差數(shù)的方差=兩樣本平均數(shù)方差之和.樣本平σ12=σ22=σ

n1=n2=n

σ12=σ22=σn1=n2=n

σ12=σ22=σn1=n2=nσ12=σ22=σ當σ12和σ22已知H0:μ1=μ2=μ時

當σ12和σ22已知H0:μ1=μ2=μ時當σ12和σ22未知,兩樣本都為大樣本時H0:μ1=μ2=μ時

當σ12和σ22未知,兩樣本都為大樣本時H0:μ1=μ2當σ12和σ22未知,兩樣本都為小樣本時H0:μ1=μ2=μ時

當σ12和σ22未知,兩樣本都為小樣本時H0:μ1=μ24、作出推斷,并解釋之接受H0否定HA或否定H0接受HA或4、作出推斷,并解釋之接受H0否定HA或否定H0接受HA或兩個樣本平均數(shù)成組數(shù)據(jù)平均數(shù)的比較成對數(shù)據(jù)平均數(shù)的比較兩成組數(shù)據(jù)平均數(shù)的比較成對數(shù)據(jù)平均數(shù)的比較成組數(shù)據(jù)平均數(shù)的比較

如果兩個樣本的各個變量是從各自總體中隨機抽取的,兩個樣本之間的變量沒有任何關聯(lián),即兩個抽樣樣本彼此獨立,則不論兩樣本的容量是否相同,所得數(shù)據(jù)皆為成組數(shù)據(jù)。兩組數(shù)據(jù)以組平均數(shù)作為相互比較的標準,來檢驗其差異的顯著性。根據(jù)兩樣本所屬的總體方差是否已知和樣本大小不同而采用不同的檢驗方法。成組數(shù)據(jù)平均數(shù)的比較如果兩個樣本的各個變量是1、兩個總體方差σ12和σ22已知,或σ12和σ22未知,但兩個樣本都是大樣本,即n1>30且n2>30時,用u檢驗法。例:已知放射強度遵從正態(tài)分布。對甲、乙兩個放射污染區(qū)作放射強度測定。從甲地取得樣本數(shù)為n1=63,均值為62.38γ,乙地取得樣本數(shù)為n2=74,均值為66.78γ,甲、乙兩地方差分別是σ12=10.8,σ22=13.3。問兩地受放射污染程度是否相同。分析(1)這是兩個樣本(成組數(shù)據(jù))平均數(shù)比較的假設檢驗,因σ12和σ22已知,用u檢驗。(2)因事先不知甲、乙兩地受放射污染程度孰高孰低,用雙尾檢驗。1、兩個總體方差σ12和σ22已知,或σ12和σ22未知(1)假設(2)水平(3)檢驗(4)推斷H0:μ1=μ2,即認為兩地受放射污染程度相同。HA:μ1≠μ2選取顯著水平α=0.05在0.05顯著水平上,拒絕H0,接受HA;認為兩地受放射污染程度不相同。︱u︱>u0.025=1.96P<0.05(1)假設(2)水平(3)檢驗(4)推斷H0:μ1=μ22、兩個總體方差σ12和σ22未知,且兩個樣本都是小樣本,即n1<30且n2<30時,用t檢驗法。(1)如果σ12=σ22=σ2Se2σ2

平均數(shù)差數(shù)的標準誤2、兩個總體方差σ12和σ22未知,且兩個樣本都是小樣本,H0:μ1=μ2=μdf=(n1-1)+(n2-1)=n1+n2-2H0:μ1=μ2=μdf=(n1-1)+(n2-1)=n例:用甲、乙兩種方法同時測定某廢水樣品中鋁含量。其中甲法測定10次,平均測定結(jié)果為5.28μg/L,標準差為1.11μg/L;乙法測定9次,平均測定結(jié)果為4.03μg/L,標準差為1.04μg/L。問兩種方法測定結(jié)果有無顯著性差別?分析(1)這是兩個樣本平均數(shù)的檢驗,σ12和σ22未知,且為小樣本,用t檢驗。(2)事先不知兩種方法測定結(jié)果孰高孰低,用雙尾檢驗。例:用甲、乙兩種方法同時測定某廢水樣品中鋁含量。其中甲法測定(1)假設(2)水平(3)檢驗H0:σ12=σ22=σ2HA:σ12≠σ22選取顯著水平α=0.05

(4)推斷兩樣本方差相等。第一步F檢驗(1)假設(2)水平(3)檢驗H0:σ12=σ22=σ2(3)檢驗(1)假設(2)水平H0:μ1=μ2,即認為兩種方法測定結(jié)果無差異。HA:μ1≠μ2選取顯著水平α=0.05第二步t檢驗(3)檢驗(1)假設(2)水平H0:μ1=μ2,選取顯著(4)推斷在0.05顯著水平上,否定H0,接受HA;可認為這兩種方法測定結(jié)果有顯著性差別,即至少有一種方法存在系統(tǒng)誤差。t>t0.05(17)=2.110df=(n1-1)+(n2-1)=17(4)推斷在0.05顯著水平上,否定H0,接受HA;可認為這(2)σ12≠σ22,n1=n2=n

Se2σ2

df=n-1平均數(shù)差數(shù)的標準誤當n1=n2=n時(2)σ12≠σ22,n1=n2=nSe2σ2df=n-例:調(diào)查污染程度不同的甲、乙兩農(nóng)田中黃豆千粒重(g),調(diào)查結(jié)果如下:甲農(nóng)田:50,47,42,43,39,51,43,38,44,37乙農(nóng)田:36,38,37,38,36,39,37,35,33,37檢驗兩農(nóng)田中黃豆千粒重有無差異。兩樣本方差不相等。第一步F檢驗例:調(diào)查污染程度不同的甲、乙兩農(nóng)田中黃豆千粒重(g),調(diào)查結(jié)分析(1)σ12和σ22未知,且不相等,都小樣本,且n1=n2,用df=n-1的t檢驗。(2)事先不知道兩地黃豆千粒重孰高孰低,故而用雙尾檢驗。第二步t檢驗分析(1)σ12和σ22未知,且不相等,都小樣本,(2)事(1)假設(2)水平(3)檢驗H0:μ1=μ2,即認為兩農(nóng)田中黃豆千粒重無顯著差異。HA:μ1≠μ2選取顯著水平α=0.05(1)假設(2)水平(3)檢驗H0:μ1=μ2,即認為兩(4)推斷在0.05顯著水平上,否定H0,接受HA;認為兩農(nóng)田中黃豆千粒重存在明顯差異,即甲農(nóng)田的千粒重顯著高于乙農(nóng)田。︱t︱>t0.05(9)=2.262P<0.05df=n-1=9(4)推斷在0.05顯著水平上,否定H0,接受HA;認為兩農(nóng)(3)σ12≠σ22,n1≠n2,采用近似地t檢驗,即

Aspin-Welch檢驗法。(3)σ12≠σ22,n1≠n2,采用近似地t檢驗,即檢驗兩排污口中含油量是否有極顯著差異?分析n1≠n2

,用近似的t分布,使用雙尾檢驗。

而B排污口中含油量(mg/L)5次,x2=11.7,s22=0.135

測定A排污口中含油量(mg/L)10次,x1=14.3,s12=1.621(1)假設(2)水平(3)檢驗H0:σ12=σ22=σ2HA:σ12≠σ22(4)推斷兩樣本方差有顯著不同。選取顯著水平α=0.05

例:第一步F檢驗檢驗兩排污口中含油量是否有極顯著差異?分析n1≠n2(1)假設(2)水平(3)檢驗H0:μ1=μ2,即兩排污口中含油量沒有極顯著差別。HA:μ1≠μ2選取顯著水平α=0.01第二步近似t檢驗(1)假設(2)水平(3)檢驗H0:μ1=μ2,即兩排污口中(4)推斷在0.01顯著水平上,否定H0,接受HA;認為兩排污口中含油量有極顯著差異,A排污口中含油量極顯著的高于B排污口。t0.01(12)=3.056P<0.01(4)推斷在0.01顯著水平上,否定H0,接受HA;認為兩排成對數(shù)據(jù)平均數(shù)的比較

將性質(zhì)相同的兩個樣本(供試單位)配偶成對,每一對除隨機地給予不同處理外,其他試驗條件應盡量一致,以檢驗處理的效果,所得的觀測值稱為成對數(shù)據(jù)。成對數(shù)據(jù)平均數(shù)的比較將性質(zhì)相同的兩個樣本(供試單位)x1x2樣本1樣本2……n對樣本差數(shù)的平均數(shù)等于樣本平均數(shù)的差數(shù)x1x2樣本1樣本2……n對樣本差數(shù)的平均數(shù)等于樣本平均數(shù)的H0:μd=0df=n-1樣本差數(shù)的方差樣本差數(shù)平均數(shù)的標準誤t值H0:μd=0df=n-1樣本差數(shù)的方差樣本差數(shù)平均數(shù)例:某地對10個采樣點不同深度的土壤進行采樣.測定土壤中鎘的含量,結(jié)果如右表。問不同深度土壤中鎘元素垂直分布有無顯著性差異?

分析此題為成對數(shù)據(jù),事先不知不同土壤深度鎘含量孰高孰低,用雙尾。某地不同深度土壤中鎘含量(ppm)采樣點深度(cm)差數(shù)0-2020-40d10.280.36-0.0820.320.230.0930.270.240.0340.340.310.0350.290.32-0.0360.270.31-0.0470.330.320.0180.310.300.0190.290.34-0.05100.280.280例:某地對10個采樣點不同深度的土壤進行采樣.測定土壤中鎘的(1)假設(2)水平(3)檢驗H0:μd=0HA:μd≠0α=0.05(4)推斷在0.05顯著水平上,接受H0;即0—20cm和20一40cm兩土壤層的鎘含量相同。︱t︱<t0.025(9)=2.262已知(1)假設(2)水平(3)檢驗H0:μd=0HA:第三節(jié)樣本頻率的假設檢驗第三節(jié)樣本頻率的假設檢驗污染數(shù)量

少多污染范圍大小污染程度高低環(huán)境質(zhì)量達標超標二項分布頻率分布超標率數(shù)量比百分率百分率二項成數(shù)環(huán)境指標藥物致病致病不致病致病率污染數(shù)量少多污染范圍大小污染程度高低環(huán)境質(zhì)量達標超標二頻超頻率的假設檢驗當np或nq<5由二項式(p+q)n展開式直接檢驗P(x)<0.05,差異顯著;P(x)>0.05,差異不顯著。頻率的假設檢驗當np或nq<5由二項式(p+q)n頻率的假設檢驗當np和nq>30中心極限定理正態(tài)分布(u檢驗)近似合格率超標率百分率數(shù)量比頻率的假設檢驗當np和nq>30中心極限定理正態(tài)分頻率的假設檢驗當5<np或nq<30

由于二項總體的百分數(shù)(頻率)是由某一屬性的個體計算來的整數(shù),所以是離散型的。當樣本不太大時,把它當作連續(xù)型的近似正態(tài)總體來處理,結(jié)果會有些出入,容易發(fā)生第一類錯誤。補救的辦法時仍按正態(tài)分布的假設檢驗計算,但必須進行連續(xù)性矯正,即隨機變量所落的區(qū)間+0.5,如一個樣本由矯正為。在經(jīng)連續(xù)型校正之后所作的推斷其準確性不亞于2×2列聯(lián)表。頻率的假設檢驗當5<np或nq<30由一、一個樣本頻率的假設檢驗樣本頻率假設檢驗一、一個樣本頻率樣本頻率假設檢驗適用范圍:檢驗一個樣本頻率(記為)和某一理論值或期望值p的差異顯著性。適用范圍:檢驗一個樣本頻率(記為)和某一理論值或期

在二項分布中,事件A發(fā)生的頻率

x/n稱為二項成數(shù),即百分數(shù)或頻率。則二項成數(shù)的平均數(shù)和標準差分別為:

也稱為二項總體成數(shù)的標準誤,當p未知時,常以樣本百分數(shù)來估計。此時上式改寫為:

=

稱為樣本成數(shù)標準誤。在二項分布中,事件A發(fā)生的頻率x/n樣本頻率的標準誤其中q=1-p1、當np或nq>30,不需連續(xù)性矯正,則u值為:樣本頻率的標準誤其中q=1-p1、當np或nq>2、當5<np或nq<30時,需要進行連續(xù)性矯正,uc值為:如果np<30,且n<30,其中“+”表示在>p時取“-”;<p時取“+”。2、當5<np或nq<30時,需要進行連續(xù)性矯正,uc例:按規(guī)定,某工廠排出的污水超標率不超過8%時即認為合格?,F(xiàn)對該廠排出的污水隨機取樣210次,測定結(jié)果有23次超標。問抽樣測定結(jié)果是否達到合格規(guī)定要求?(3)排出的污水超標率不超過8%時即認為合格,用單尾檢驗。分析(1)一個樣本頻率的假設檢驗;(2)nq>30,無需連續(xù)矯正,用u檢驗;例:按規(guī)定,某工廠排出的污水超標率不超過8%時即認為合格?,F(xiàn)(1)假設(2)水平(3)檢驗(4)推斷H0:p=8%即某工廠排出的污水超標率≤8%;HA:p>8%選取顯著水平α=0.05u<u0.05=1.645,P>0.05在0.05顯著水平上,接受H0;認為抽樣測定結(jié)果達到合格規(guī)定要求。(1)假設(2)水平(3)檢驗(4)推斷H0:p=8%選取顯例:某地區(qū)受有毒氣體污染,按照相關規(guī)定,中毒>0.80為重污染,現(xiàn)隨機檢查了100人,結(jié)果有78人中毒,問某地區(qū)是否受到有毒氣體的嚴重污染?(3)只有中毒率≤0.80,才認為是非重污染,故采用單尾檢驗。分析(1)一個樣本頻率的假設檢驗;(2)np和nq>5,但nq<30,需要進行連續(xù)矯正,由于n>30,用u檢驗;例:某地區(qū)受有毒氣體污染,按照相關規(guī)定,中毒>0.80為重污(1)假設(2)水平(3)檢驗(4)推斷H0:p≤0.80,即該地區(qū)沒受到有毒氣體的嚴重污染。HA:p>0.80選取顯著水平α=0.05uc<1.645,P>0.05在0.05顯著水平上,接受H0,否定HA;認為該地區(qū)沒受到有毒氣體的嚴重污染。(1)假設(2)水平(3)檢驗(4)推斷H0:p≤0.80二、兩個樣本頻率的假設檢驗樣本頻率假設檢驗二、兩個樣本頻率樣本頻率假設檢驗適用范圍:檢驗兩個樣本頻率和差異的顯著性。一般假定兩個樣本的方差是相等的,即適用范圍:檢驗兩個樣本頻率和一般假兩個樣本頻率差數(shù)的標準誤H0:p1=p2=p,q1=q2=q兩個樣本頻率差數(shù)的標準誤H0:p1=p2=p,q當n1=n2=n時

在總體p1和p2未知,假定條件下,可用兩樣本頻率的加權(quán)平均值作為對p1和p2的估計,即:當n1=n2=n時在總體p1和p2未知,假1、當np或nq>30,不需連續(xù)性矯正,用u檢驗:在H0:p1=p2下,1、當np或nq>30,不需連續(xù)性矯正,用u檢驗:在2、當5<np或nq<30,需進行連續(xù)性矯正,如果n>30,用u檢驗:在H0:p1=p2下,2、當5<np或nq<30,需進行連續(xù)性矯正,2、當5<np或nq<30,需進行連續(xù)性矯正,如果n<30,用t檢驗:在H0:p1=p2下,2、當5<np或nq<30,需進行連續(xù)性矯正,例:研究地勢對小麥銹病發(fā)病的影響比較兩塊麥田銹病發(fā)病率是否有顯著性差異。低洼地麥田378株,其中銹病株342株高坡地麥田396株,其中銹病株313株(3)事先不知兩塊麥田的銹病發(fā)病率孰高孰低,用雙尾檢驗。分析(1)2個樣本頻率的假設檢驗;(2)np和nq>30,無需連續(xù)矯正,用u檢驗;例:研究地勢對小麥銹病發(fā)病的影響比較兩塊麥田銹病發(fā)病率是否有(1)假設(2)水平(3)檢驗H0:p1=p2即兩塊麥田銹病發(fā)病率沒有顯著差異。HA:p1≠p2選取顯著水平α=0.01(1)假設(2)水平(3)檢驗H0:p1=p2即兩塊麥田在0.01顯著水平上,否定H0,接受HA;認為兩塊麥田銹病發(fā)病率有極顯著差異,即地勢對小麥銹病的發(fā)生有極顯著影響作用,低洼地小麥銹病的發(fā)病率極顯著高于高坡地。(4)推斷u>2.58,P<0.01在0.01顯著水平上,否定H0,接受HA;認為兩塊麥田銹病發(fā)例:某魚場發(fā)生了藥物中毒,檢驗甲、乙兩池發(fā)生藥物中毒以后,魚的死亡率是否有顯著性差異。抽查甲池中的29尾魚,有20尾死亡抽查乙池中的28尾魚,有21尾死亡(3)事先不知兩池魚的死亡率孰高孰低,用雙尾檢驗。分析(1)2個樣本頻率的假設檢驗;(2)5<np和nq<30,需進行連續(xù)矯正,因n1<30,n2<30,用t檢驗;例:某魚場發(fā)生了藥物中毒,檢驗甲、乙兩池發(fā)生藥物中毒以后,魚(1)假設(2)水平(3)檢驗H0:p1=p2即甲乙兩池魚的死亡率沒有顯著差異HA:p1≠p2選取顯著水平α=0.05(1)假設(2)水平(3)檢驗H0:p1=p2即甲乙兩池df=29+28-2=55在0.05顯著水平上,接受H0,否定HA;認為發(fā)生藥物中毒后,甲、乙兩魚池魚的死亡率沒有顯著差異。(4)推斷t0.05(55)=2.004,tc<t0.05(55)df=29+28-2=55在0.05顯著水平上,接受H0,否參數(shù)估計:用樣本統(tǒng)計量來估計總體的參數(shù)點估計:區(qū)間估計:用由樣本數(shù)據(jù)所計算出來的單個數(shù)值對總體參數(shù)直接估計,例如利用樣本平均數(shù)的值估計總體平均數(shù)參數(shù)。所謂的區(qū)間估計就是在一定的概率保證下指出總體參數(shù)的可能范圍,這個可能的范圍稱為置信區(qū)間,相應的概率保證稱為置信水平或置信度。如:某一研究發(fā)現(xiàn)豬仔出生重平均數(shù)的置信水平為95%的置信區(qū)間為(1.02kg,1.38kg)第四節(jié):參數(shù)的區(qū)間估計與點估計參數(shù)估計:用樣本統(tǒng)計量來估計總體的參數(shù)點估計:區(qū)間估計:一、點估計(PointEstimation)點估計就是用樣本特征數(shù)來估計相應的總體特征數(shù),如用樣本平均數(shù),中位數(shù)或眾數(shù)來估計總體平均數(shù)。估計同一個參數(shù)的樣本統(tǒng)計量(常稱為估計量——estimator)可能有好幾個,如何決定哪個最好?一、點估計(PointEstimation)點估計就一個好的估計量應滿足三個條件:3.相容(consistent)1.無偏(unbiased)2.有效(efficient)一個好的估計量應滿足三個條件:3.相容(consistent1.無偏估計量(unbiasedestimator)如果一個統(tǒng)計量的理論平均數(shù)等于總體參數(shù),這個統(tǒng)計量就被稱為無偏估計量。(1)是μ的無偏估計值。(2)s2是σ2的無偏估計值。1.無偏估計量(unbiasedestimator)如果一2.有效估計量(efficientestimator)在樣本含量相同的情況下,如果一個統(tǒng)計量的方差小于另一個統(tǒng)計量的方差,則前一個統(tǒng)計量是更有效的估計量。從一個整體總體中,抽取含量為n的樣本,樣本平均數(shù)的方差為當n充分大時,中位數(shù)m的方差為2.有效估計量(efficientestimator)在樣3.相容估計量(consistentestimator)若統(tǒng)計量的取值,任意接近于參數(shù)值的概率隨樣本含量n的無限增加而趨于1,則該統(tǒng)計量稱為參數(shù)的相容估計量。(樣本越大,估計量越好)樣本平均數(shù)是總體平均數(shù)的相容估計量。樣本方差也是總體方差的相容估計量。3.相容估計量(consistentestimator)若二、區(qū)間估計(IntervalEstimation)1.區(qū)間估計的基本方法定義:根據(jù)樣本統(tǒng)計量,以一定的可靠程度推斷總體參數(shù)所在的區(qū)間范圍。1-α就是區(qū)間(置信區(qū)間)估計的可靠程度。一般求法:依據(jù)樣本統(tǒng)計量的分布來求二、區(qū)間估計(IntervalEstimation)這里,我們首先討論總體分布為正態(tài)的情形.若樣本容量很大,即使總體分布未知,應用中心極限定理,只要抽樣為大樣本,不論其總體是否為正態(tài)分布,其樣本平均數(shù)都近似服從正態(tài)分布N(μ,σ2/n),于是也可以近似求得參數(shù)的區(qū)間估計。u落在任意一個區(qū)間內(nèi)的概率可以從正態(tài)分布表中查出。這里,我們首先討論總體分布為正態(tài)的情形.若樣本容量很大

當n>30或雖然n<30,但X~N,且σ為已知,就有

對于N(0,12),有對應地有~N(0,12)-uα

uαU1-以標準正態(tài)分布進行μ的區(qū)間估計為例:~N(0,12)1-以標準正態(tài)分布進行μ的區(qū)間估計為例:第四章環(huán)境參數(shù)的統(tǒng)計推斷課件u落在(-1.96,1.96)內(nèi)的概率可以從正態(tài)分布表中查出P(-1.96≤u≤1.96)=0.951-α:置信水平抽樣分布0臨界值=1.96臨界值=-1.96a/2=0.025a/2=0.025樣本統(tǒng)計量拒絕H0拒絕H01-=0.95置信水平u落在(-1.96,1.96)內(nèi)的概率可以從正態(tài)分布表中查出區(qū)間估計的圖示95%的樣本99%的樣本90%的樣本區(qū)間估計的圖示95%的樣本99%的樣本90%的樣本無論區(qū)間估計還是點估計,都與概率顯著水平α的大小聯(lián)系在一起。α越小,則相應的置信區(qū)間就越大,也就是說用樣本平均數(shù)對總體平均數(shù)估計的可靠程度越高,但這時估計的精度就降低了。在實際應用中,應合理選取概率顯著水平α的大小,不能認為α取值越小越好。無論區(qū)間估計還是點估計,都與概率顯著水平α的大小聯(lián)系在一起。2.平均數(shù)μ

的置信區(qū)間(1)σ已知時,μ

的置信區(qū)間所以μ

的1-α

的置信區(qū)間為或?qū)懗?.平均數(shù)μ的置信區(qū)間(1)σ已知時,μ的置信區(qū)間所例,抽取35份水樣來測定某河口區(qū)水中氯離子量(mg/L),得其=1922.3mg/L,標準差s=367.9mg/L。試求其95%和99%置信度下該水中氯離子量的置信區(qū)間。已知:n=35,=1922.3,σ≈s=367.9求:①置信度1-=0.95時的置信區(qū)間[L1,L2]。②置信度1-=0.99時的置信區(qū)間[L1,L2]。例,抽取35份水樣來測定某河口區(qū)水中氯離子量(mg/L),得解:①1-=0.95時,則該水中氯離子量的95%置信度下的置信區(qū)間為[1800.4,2044.2]。解:①1-=0.95時,②1-=0.99時,

則該水中氯離子量的99%置信度下的置信區(qū)間為[1761.9,2082.7]。由上可見,置信度大(小),區(qū)間就寬(窄),精確度就低(高)。解決這一矛盾的唯一辦法是增加n。②1-=0.99時,說明:(1)置信區(qū)間不唯一,在置信度固定的條件下,置信區(qū)間越短,估計精度越高.(2)在置信度固定的條件下,n越大,置信區(qū)間越短,估計精度越高.(3)在樣本量n固定時,置信度越大,置信區(qū)間越長,估計精度越低.說明:(1)置信區(qū)間不唯一,在置信度固定的條件下,置信區(qū)間越例2與北京“全聚德”烤鴨店訂立的合同上要求鴨子2.0±0.2公斤/只,按只付錢。養(yǎng)鴨戶送來100只,平均1.88公斤/只,烤鴨店說太輕了。帶回去又養(yǎng)了幾天,平均2.12公斤/只。烤鴨店又說太肥了。鴨子合格的平均重量范圍應該是多少?顯著性水平為0.05例2與北京“全聚德”烤鴨店訂立的合同上要求鴨子2.0±0.2樣本含量不同,要求范圍不同每次送4只鴨子,要求的重量范圍是多少

kg/只?每次送16只鴨子,要求的重量范圍是1.90~2.10kg/只每次送100只鴨子,要求的重量范圍是1.96~2.04kg/只每次送400只鴨子,要求的重量范圍是1.98~2.02kg/只樣本含量不同,要求范圍不同每次送4只鴨子,要求的重量范圍是(2)σ未知時,μ的置信區(qū)間所以μ

的1-α的置信區(qū)間為或?qū)懗桑?)σ未知時,μ的置信區(qū)間所以μ的1-α的置信區(qū)例:為檢查某湖泊中魚受汞污染情況,捕得某種魚齡相近的9條魚,測得魚胸中汞含量如下(單位:ppm),1.85,1.86,1.93,2.0l,2.03,2.05,2.07,2.12,2.15,當置信水平取0.99時,求魚胸肌中汞的含量變化置信區(qū)間。已知魚胸肌中汞的含量是正態(tài)分布。

本例中,由于總體方差σ2未知,需用s2估計σ2,當df=9-1=8時,t0.01=3.355。具體計算如下例:為檢查某湖泊中魚受汞污染情況,捕得某種魚齡相近的9條魚,于是魚胸肌中汞含量變化的上、下限估計為這樣,當1—α=0.99時,汞含量置信區(qū)間為[1.89,2.13],換句話說,有99%把握汞含量變化區(qū)間在2.13ppm到1.89ppm間。

于是魚胸肌中汞含量變化的上、下限估計為這樣,當1—α=0.9例3晚稻良種汕優(yōu)63的千粒重μ0=27.5g。現(xiàn)育成一高產(chǎn)品種協(xié)優(yōu)輻819,在9個小區(qū)種植,得其千粒重為:32.5,28.6,28.4,24.7,29.1,27.2,29.8,33.3,29.7(g)(1)試問新育成品種的千粒重與汕優(yōu)63有無顯著差異?(2)求置信水平為95%的新育成品種千粒重的置信區(qū)間?例3晚稻良種汕優(yōu)63的千粒重μ0=27.5g?,F(xiàn)育成一高產(chǎn)品解:(1)H0:μ=μ0=27.5;HA:μ≠27.5

α=0.05計算檢驗統(tǒng)計量查表得t(8,0.05雙側(cè))=2.306,所以H0的拒絕域為:所以,接受H0,即新品種的千粒重與汕優(yōu)63無顯著差異。解:(1)H0:μ=μ0=27.5;HA:μ≠27.5注意:(a)置信區(qū)間也可以用來進行假設檢驗。以上述例子為例,因為95%的置信區(qū)間是(27.266,31.244),它包含了零假設中待檢驗的27.5,所以我們沒有理由拒絕H0:μ=27.5。

(b)利用置信區(qū)間進行假設檢驗的基本方法:如果置信區(qū)間包含了H0中的數(shù)值,則不拒絕H0;如果置信區(qū)間不包含H0中的數(shù)值,則拒絕H0。

(c)置信區(qū)間和假設檢驗的結(jié)論是一致的。(2)置信水平95%=1-α,所以α=0.05所以新品種千粒重95%的置信區(qū)間為(27.266,31.244)。注意:(a)置信區(qū)間也可以用來進行假設檢驗。以上述例子為對參數(shù)所進行的假設如果落在該區(qū)間之外,就說明這個假設與真實情況有本質(zhì)的不同,因而就否定零假設,接受備擇假設。置信區(qū)間是在一定置信度P=1-α下總體參數(shù)的所在范圍,故對參數(shù)所進行的假設如果落在該區(qū)間內(nèi),就說明這個假設與真實情況沒有不同,因而就可以接受零假設。對參數(shù)所進行的假設如果落在該區(qū)間之外,就說明這個假設與真實情3.方差σ2

和標準差σ的置信區(qū)間研究σ2所采用的統(tǒng)計量是∴研究σ2的置信區(qū)間是相應地,σ的置信區(qū)間是3.方差σ2和標準差σ的置信區(qū)間研究σ2所采用的統(tǒng)計量是4.平均數(shù)差μ1-μ2的置信區(qū)間(1)標準差σi已知(2)標準差σi未知,但σ1=σ2時(3)標準差σi未知,但σ1≠σ2時4.平均數(shù)差μ1-μ2的置信區(qū)間(1)標準差σi已知((1)標準差σi已知樣本統(tǒng)計量變形得:∴μ1-μ2的1-α的置信區(qū)間為:(1)標準差σi已知樣本統(tǒng)計量變形得:∴μ1-μ2的1-α的自由度為n1+n2-2的t分布(2)標準差σi未知,但σ1=σ2時樣本統(tǒng)計量利用和前面類似的推導得到μ1-μ2的1-α的置信區(qū)間為:當n1=n2=n時,上式可簡化為:自由度為(2)標準差σi未知,但σ1=σ2時樣本統(tǒng)計量利用和(3)標準差σi未知,但σ1≠σ2時樣本統(tǒng)計量其中利用和前面類似的推導得到μ1-μ2的1-α的置信區(qū)間為:(3)標準差σi未知,但σ1≠σ2時樣本統(tǒng)計量其中利用和解:查表得uα(雙側(cè))=1.96,把各值代入得:即:L1=-0.042,L2=0.072例:甲乙兩地空氣中某元素含量服從正態(tài)分布,σ12=0.013,σ22=0.012,從兩地取樣測試結(jié)果如下:n甲=30,平均數(shù)為0.03ppmm;n乙=28,平均數(shù)為0.016ppm,求當置信度為0.95時,兩地平均數(shù)差μ甲-μ乙的置信區(qū)間(α=0.05)。所以甲,乙兩地空氣中該元素含量平均數(shù)差μ甲-μ乙的置信區(qū)間為(-0.042,0.072)。解:查表得uα(雙側(cè))=1.96,把各值代入得:即:L1=

當兩個樣本為小樣本,總體方差σ12和σ22未知,且兩總體方差不相等,即σ12≠σ22時,可由兩樣本方差s12和s22對總體方差σ12和σ22的估計而算出的t值,已不是自由度df=n1+n2-2的t分布,而是近似的服從自由度df'的t分布,在置信度為P=1-α下,兩總體平均數(shù)差數(shù)μ1-μ2的區(qū)間估計為:當兩個樣本為小樣本,總體方差σ12和σ22未知,且兩總體其置信區(qū)間的下限L1和上限L2為:兩個總體平均數(shù)差數(shù)μ1-μ2的區(qū)間估計也可表示為:

上面三式中,tα,df

'為置信度為P=1-α時自由度為df'的t臨界值。其置信區(qū)間的下限L1和上限L2為:兩個總體平均數(shù)差數(shù)μ1-μ例已知某城市兩污水渠酚分布屬正態(tài)分布,數(shù)據(jù)如下(單位,mg/L):I明渠:0.6150.5560.3780.5440.8110.8410.6050.6550.6550.7560.6550.7060.6070.3880.6550.6300.6050.5040.5770.6550.5000.6050.5240.4540.4840.3600.4800.6800.5550.5570.4840.6600.4940.5850.5500.5490.5570.5490.585II明渠:0.10000.13280.11840.11480.13880.23030.21960.16520.14560.13040.13360.11760.17840.13280.02090.18680.18840.30280.16000.11080.11560.14140.12160.13900.46440.24120.08680.12720.14840.21600.13520.19240.16520.25800.26600.42320.12840.23680.15560.15080.20280.24360.1488

兩總體方差不等。試求在置信概率為95%情況下μ1—μ2的置信區(qū)間。例已知某城市兩污水渠酚分布屬正態(tài)分布,數(shù)據(jù)如下(單位,從所給數(shù)據(jù)知:n1=39,n2=43從所給數(shù)據(jù)知:n1=39,n2=43t0.025(73)=1.991其置信度為95%時,兩污水渠酚分布的差數(shù)區(qū)間估計為:0.36≤μ1-μ2≤0.44t0.025(73)=1.991其置信度為95%時,兩污水渠當兩樣本為成對資料時,在置信度為P=1-α時,兩總體平均數(shù)差數(shù)μ1-μ2的置信區(qū)間可估計為:其置信區(qū)間的下限L1和上限L2為:當兩樣本為成對資料時,在置信度為P=1-α時,兩總體平均數(shù)例:比較兩種裝置處理油污效果,有6個樣品,不同裝置處理后含油量如下:(單位ppm)

甲裝置:4.05.06.01.05.44.1

乙裝置,3.37.04.42.23.50.7試求該成對數(shù)據(jù)差的置信區(qū)間(α=0.05)。

解考察例中6對數(shù)據(jù)差:0.7,-2.0,1.6,-1.2,1.9,3.4自由度n—1=6—1=5α=0.05t0.05(5)=2.571故有這樣可知上述數(shù)據(jù)差值置信區(qū)間為[-1.35,2.81]。例:比較兩種裝置處理油污效果,有6個樣品,不同裝置處理后含油5、總體頻率p、兩總體頻率差數(shù)p1-p2的區(qū)間估計在置信度P=1-α下,對一個總體頻率P的區(qū)間估計為:其置信區(qū)間的下限L1和上限L2為:5、總體頻率p、兩總體頻率差數(shù)p1-p2的區(qū)間估計在置信度P當樣本容量較小或者np、nq遠小于30時,對總體頻率p進行的區(qū)間估計和點估計,需要做連續(xù)性校正,其校正公式為:當樣本容量較小或者np、nq遠小于30時,對總體頻率p進在進行兩個總體頻率p1-p2的區(qū)間估計和點估計時,一般應明確兩個頻率有顯著差異才有意義。在置信度為P=1-α下,兩總體頻率差數(shù)p1-p2的區(qū)間估計為在進行兩個總體頻率p1-p2的區(qū)間估計和點估計時,一般應例用例計算結(jié)果,試進行置信度為99%的兩塊麥田銹病發(fā)病率差數(shù)的區(qū)間估計。計算得由于np、nq均大于30,故可以用例用例計算結(jié)果,試進行置信度為99%的兩塊麥田銹病發(fā)病率差當P=1-α=0.99時,α=0.01,u0.01=2.58所以置信度為99%的兩塊麥田銹病發(fā)病率差數(shù)的上、下限可估計為當P=1-α=0.99時,α=0.01,u0.01=2第五節(jié)方差的同質(zhì)性檢驗所謂方差的同質(zhì)性,就是指各個總體的方差是相同的。方差的同質(zhì)性檢驗就是要從各樣本的方差來推斷其總體方差是否相同第五節(jié)方差的同質(zhì)性檢驗所謂方差的同質(zhì)性,就是指各個總體的方一、一個樣本方差的同質(zhì)性檢驗我們知道從標準正態(tài)總體中抽取k個獨立u2之和為χ2,即當用樣本平均數(shù)估計μ時,則有:一、一個樣本方差的同質(zhì)性檢驗我們知道從標準正態(tài)總體中抽取k個

上式中,分子表示樣本的離散程度,分母表示總體方差,其服從自由度為n-1的分布.得由樣本方差上式中,分子表示樣本的離散程度,分母表示總體例:已知某農(nóng)田受到重金屬的污染,經(jīng)抽樣測定其鉛濃度為4.2,4.5,3.6,4.7,4.0,3.8,3.7,4.2μg·g-1,樣本方差為0.150(μg·g-1)2,試檢驗受到污染的農(nóng)田鉛濃度的方差是否與正常農(nóng)田鉛濃度的方差0.065(μg·g-1)2相同。此題為一個樣本方差與總體方差的同質(zhì)性檢驗(1)假設(2)水平選取顯著水平α=0.05

H0:σ2=0.065,即受到污染的農(nóng)田鉛濃度的方差與正常農(nóng)田鉛濃度的方差相同。HA:σ2≠0.065例:已知某農(nóng)田受到重金屬的污染,經(jīng)抽樣測定其鉛濃度為4.(3)檢驗查附表,當df=8-1=7時,(4)推斷否定H0,接受HA,即樣本方差與總體方差是不同質(zhì)的,認為受到污染的農(nóng)田鉛濃度的方差與正常農(nóng)田鉛濃度的方差0.065(μg·g-1)2有顯著差異(3)檢驗查附表,當df=8-1=7時,(4)推斷否定H0二、兩個樣本方差的同質(zhì)性檢驗假設兩個樣本容量分別為n1和n2,方差分別為s12和s22,總體方差分別為σ12和σ22,當檢驗σ12和σ22是否同質(zhì)時,可用F檢驗法。當兩樣本總體均服從正態(tài)分布,且兩樣本的抽樣是隨機的和獨立的,其F值等于兩樣本方差s12和s22之比。二、兩個樣本方差的同質(zhì)性檢驗假設兩個樣本容量分別為n1和n2且服從df1=n1-1,df2=n2-1的F分布。當F<Fα時,接受H0:σ12=σ22,即認為兩樣本的方差是同質(zhì)的,當F>Fα時,否定H0:σ12≠σ22,即認為兩樣本的方差是不同質(zhì)的。且服從df1=n1-1,df2=n2-1的F分布。當F<Fα例題檢驗例中兩農(nóng)田中黃豆千粒重的方差是否同質(zhì)。該題中,s12=22.933,s22=2.933,n1=n2=10(1)假設H0:σ12=σ22,HA:σ12≠σ22(2)水平選取顯著水平α=0.05例題檢驗例中兩農(nóng)田中黃豆千粒重的方差是否同質(zhì)。該題中,s1(3)檢驗(4)推斷否定H0,接受HA,即認為兩農(nóng)田中黃豆千粒重有無差異的方差不是同質(zhì)的(3)檢驗(4)推斷否定H0,接受HA,即認為兩農(nóng)田中黃豆千正態(tài)總體區(qū)間估計與顯著性檢驗的關系1、區(qū)間估計亦可用于假設測驗。因為置信區(qū)間是一定置信水平下總體參數(shù)的所在范圍,故對參數(shù)所作假設若恰落在該范圍內(nèi),則這個假設與參數(shù)就沒有真實的不同,因而接受H0;反之,如果對參數(shù)所作的假設落在置信區(qū)間之外,則說明假設與參數(shù)不同,所以應否定H0,接受HA。2、直觀上有一定差異。顯著性檢驗是把H0:μ=μ0視為固定常數(shù),依據(jù)它建立理論分布,再來判斷實際觀察值是否小概率事件;區(qū)間估計則是把觀察值視為最可能的μ的取值(點估計),再以它為中心建立一個區(qū)間,并給出總體參數(shù)μ落入這一區(qū)間的概率(置信水平)。正態(tài)總體區(qū)間估計與顯著性檢驗的關系1、區(qū)間估計亦可用于假設演講完畢,謝謝觀看!演講完畢,謝謝觀看!環(huán)境參數(shù)的統(tǒng)計推斷(statisticalinference)第四章環(huán)境參數(shù)的統(tǒng)計推斷(statisticalinferenc第四章環(huán)境參數(shù)的統(tǒng)計推斷統(tǒng)計推斷由一個樣本或一糸列樣本所得的結(jié)果來推斷總體的特征假設檢驗參數(shù)估計第四章環(huán)境參數(shù)的統(tǒng)計推斷統(tǒng)由一個樣假設檢驗參數(shù)估計第四章第一節(jié)第二節(jié)第三節(jié)第四節(jié)第五節(jié)假設檢驗的原理與方法樣本平均數(shù)的假設檢驗樣本頻率的假設檢驗參數(shù)的區(qū)間估計與點估計方差的同質(zhì)性檢驗第四章第一節(jié)第二節(jié)第三節(jié)第四節(jié)第五節(jié)假設檢驗的原理與方法樣本第一節(jié)假設檢驗的原理與方法第一節(jié)假設檢驗的原理與方法一概念:

假設檢驗(hypothesistest)又稱顯著性檢驗(significancetest),就是根據(jù)總體的理論分布和小概率原理,對未知或不完全知道的總體提出兩種彼此對立的假設,然后由樣本的實際結(jié)果,經(jīng)過一定的計算,作出在一定概率意義上應該接受的那種假設的推斷。第一節(jié)假設檢驗一概念:第一節(jié)假設檢驗小概率原理

概率很小的事件在一次抽樣試驗中實際是幾乎不可能發(fā)生的。=0.05/0.01

如果假設一些條件,并在假設的條件下能夠準確地算出事件A出現(xiàn)的概率α為很小,則在假設條件下的n次獨立重復試驗中,事件A將按預定的概率發(fā)生,而在一次試驗中則幾乎不可能發(fā)生。小概率原理概率很小的事件在一次抽樣試驗=假設檢驗參數(shù)檢驗非參數(shù)檢驗平均數(shù)的檢驗頻率的檢驗方差的檢驗秩和檢驗符號檢驗游程檢驗秩相關檢驗假參數(shù)檢驗非參數(shù)檢驗平均數(shù)的檢驗頻率的檢驗方差的檢驗秩和檢驗二、假設檢驗的步驟

治療前0

=126

2=240

N(126,240)治療后n=6x=136未知那么=0?

即克矽平對治療矽肺是否有效?例:設矽肺病患者的血紅蛋白含量具平均數(shù)0=126(mg/L),

2=240

(mg/L)2的正態(tài)分布?,F(xiàn)用克矽平對6位矽肺病患者進行治療,治療后化驗測得其平均血紅蛋白含量x=136(mg/L)。二、假設檢驗的步驟治療前0=126N1、提出假設對立無效假設/零假設/檢驗假設備擇假設/對應假設0

0

誤差效應處理效應H0HA1、提出假設對無效假設備擇假設0=0例:克矽平治療矽肺病是否能提高血紅蛋白含量?平均數(shù)的假設檢驗檢驗治療后的總體平均數(shù)是否還是治療前的126(mg/L)?x-0=136-126=10(mg/L)這一差數(shù)是由于治療造成的,還是抽樣誤差所致。本例中零假設是指治療后的血紅蛋白平均數(shù)仍和治療前一樣,二者來自同一總體,接受零假設則表示克矽平?jīng)]有療效。而相對立的備擇假

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論