版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第三講 方差與回歸分析1簡單比較實(shí)驗(yàn)回顧兩獨(dú)立樣本t檢驗(yàn)小樣本,方差未知,分方差齊和方差不齊兩種情形。兩獨(dú)立樣本Z檢驗(yàn)兩個總體為正態(tài),且方差已知;或者大樣本情形。配對樣本t檢驗(yàn)實(shí)質(zhì)轉(zhuǎn)化為一個總體均值與已知值(0)的比較。2假設(shè)兩種配方的方差是相等的,檢驗(yàn)統(tǒng)計(jì)量是,是的一個估計(jì)量3假設(shè)兩種配方的方差不相等,檢驗(yàn)統(tǒng)計(jì)量是,4若 已知,且在原假設(shè)為真的前提下有56本例7單側(cè)檢驗(yàn)8樣品桿尖1桿尖2di=y1i-y22443158806321724-2899095411045-19配對樣本的基本模型是桿尖i在樣品j上的讀數(shù)是桿尖i的硬度平均讀數(shù)值是樣品j的硬度效應(yīng)(區(qū)組效應(yīng))1
2、0計(jì)算第j個配對值dj因此, 就等價于當(dāng)用配對方式出現(xiàn)是,硬度效應(yīng)就會消失11模型轉(zhuǎn)換轉(zhuǎn)化為總體方差未知時,單總體樣本與已知均值u=0的比較t檢驗(yàn)12本例13配對與獨(dú)立的比較:置信區(qū)間配對獨(dú)立14關(guān)于方差齊性檢驗(yàn)兩個正態(tài)總體方差是否相等?當(dāng)H0為真時,1516平衡設(shè)計(jì)與非平衡設(shè)計(jì)當(dāng)每一種處理的重復(fù)次數(shù)相等的時候,我們稱這種設(shè)計(jì)為平衡設(shè)計(jì),相應(yīng)的實(shí)驗(yàn)為平衡實(shí)驗(yàn)。反之,如果重復(fù)次數(shù)不相等,則稱之為非平衡設(shè)計(jì)與非平衡實(shí)驗(yàn)。17樣本量的有關(guān)問題18樣本量與正態(tài)性假設(shè)(一)前述t檢驗(yàn)其實(shí)要求總體符合正態(tài)分布,意味著之前要對總體是否是正態(tài)總體進(jìn)行一個所謂的正態(tài)性檢驗(yàn)。當(dāng)樣本量很小時候,進(jìn)行正態(tài)性檢驗(yàn)的效率
3、本身不高。因此只能根據(jù)常識判斷是否符合正態(tài)分布。如果是小樣本,總體的確不符合正態(tài)分布,此時需要用到非參數(shù)檢驗(yàn)的方法,此時效率更低,而且在小樣本情況下難以得出有效結(jié)論。19樣本量與正態(tài)性假設(shè)(二)事實(shí)上,只要實(shí)驗(yàn)數(shù)據(jù)滿足隨機(jī)化原則,即使總體不符合正態(tài)分布,用t檢驗(yàn)方法與非參數(shù)方法檢驗(yàn)結(jié)果總是很接近的。而在大樣本的情況下,即使總體不符合正態(tài)分布,也可以利用中心極限定理認(rèn)為統(tǒng)計(jì)量總是近似符合正態(tài)分布。 因此,總體是否為正態(tài),我們并不太關(guān)注。此約束條件可以放松。20樣本量與檢驗(yàn)的效率樣本量越大,檢驗(yàn)的效率越高,即當(dāng)樣本量很大時,即使是細(xì)微的差異,也可能在統(tǒng)計(jì)上是顯著的。但是這在統(tǒng)計(jì)上并非總是需要的,有
4、些統(tǒng)計(jì)上的顯著差異在專業(yè)上也許是無意義的。因此,對統(tǒng)計(jì)檢驗(yàn)往往不能簡單地關(guān)心兩個處理之間是否存在差異,而是關(guān)心這種差異是否達(dá)到某種極限。21樣本量與檢驗(yàn)的條件等方差檢驗(yàn)的效率要高于異方差,在樣本量較小的條件下,這種差異比較明顯,但是在大樣本的場合下,兩種檢驗(yàn)的效率就非常接近了。但這時推薦使用異方差的檢驗(yàn)結(jié)果。因?yàn)榈确讲罴僭O(shè)總是“軟”的,總是我們不能“拒絕原假設(shè)”的條件下做出的,而異方差則是硬結(jié)論??梢栽谌魏螛颖玖肯孪茸霎惙讲顥l件下的檢驗(yàn),如果此時都能拒絕原假設(shè),則就不必進(jìn)行等方差條件下的檢驗(yàn)了。若檢驗(yàn)不出顯著差異,則可以進(jìn)行方差齊性檢驗(yàn),再在方差齊的條件下進(jìn)行檢驗(yàn)。22方差分析23方差分析在實(shí)
5、驗(yàn)設(shè)計(jì)中的作用影響實(shí)驗(yàn)指標(biāo)的因素可以只有一個,也可以有多個,這些稱為factor。各個因素可以取多個水平,因此,不同的因素及其不同的水平,都可以看作不同的總體。通過實(shí)驗(yàn)數(shù)據(jù)來分析不同因素和不同水平對實(shí)驗(yàn)指標(biāo)的影響程度的方法,就是方差分析方法。24方差分析的主要內(nèi)容單因素實(shí)驗(yàn)的方差分析雙因素實(shí)驗(yàn)的方差分析多因素實(shí)驗(yàn)的方差分析25單因素實(shí)驗(yàn)的方差分析26單因素方差分析模型因素水平12niA1x11x12x1n1A2x21x22x2n2Aixi1xi2xiniAaxa1xa2xana27模型的三項(xiàng)基本假定正態(tài)性:所有數(shù)據(jù)符合正態(tài)分布;(均值不一定相等)方差齊性:所有數(shù)據(jù)的方差相等;(不同總體的方差相
6、等)隨機(jī)性(所有實(shí)驗(yàn)數(shù)據(jù)相互獨(dú)立,即誤差項(xiàng)相互獨(dú)立)。28模型Ai水平下有樣本數(shù)據(jù)xi1,xi2,xini來自于正態(tài)總體2930方差分析的任務(wù)是檢驗(yàn)該線性統(tǒng)計(jì)模型中a個總體 的均值 是否相等31固定效應(yīng)模型與隨機(jī)效應(yīng)模型簡單了解32固定效應(yīng)模型a個處理(水平)由實(shí)驗(yàn)者具體選定。 且滿足約束條件得到的相關(guān)結(jié)論僅適用于分析中所考慮的因素水平,不能推廣至未曾明確考慮的相似處理中。33隨機(jī)效應(yīng)模型(方差分量模型)把a(bǔ)個處理(水平)看作是來自一個較大的處理總體的一個隨機(jī)樣本。在此情形下,希望能夠把結(jié)論推廣至總體所有可能的處理當(dāng)中。而不管它在分析中是否明確考慮。此時 是隨機(jī)變量。例如實(shí)驗(yàn)者關(guān)注很多可能水平
7、的因素,若從這多個水平中隨機(jī)選取a個水平,則稱因素是隨機(jī)的。34總離差平方和的分解水平Ai下的樣本均值樣本數(shù)據(jù)的總均值總離差平方和35總離差平方和的分解36總離差平方和的分解總離差平方和因素A效應(yīng)平方和,組間差A(yù)i水平下樣本值與樣本均值之間的差異,由于隨機(jī)誤差引起的,稱為誤差平方和37總離差平方和的分布H0成立時(即因素水平效應(yīng)為零時,即所有樣本數(shù)據(jù)來自于同一個正態(tài)總體)38誤差平方和的分布無論H0成立與否39因素A效應(yīng)的平方和404142在原假設(shè)成立的條件下而43事實(shí)上44在H0成立的條件下,統(tǒng)計(jì)量Mean Square均方4546簡化計(jì)算公式P8例題1.1.1思考:請問這里的F檢驗(yàn)是單側(cè)還
8、是雙側(cè)的?47完全隨機(jī)化的單因素實(shí)驗(yàn)設(shè)計(jì)例:產(chǎn)品開發(fā)工程師考慮讓合成纖維的抗拉強(qiáng)度增加的方案。根據(jù)經(jīng)驗(yàn),抗拉強(qiáng)度會受纖維中所含的棉花的比例的影響。而且還知道,若要成品布具有所希望的質(zhì)量特性(受恒壓加工處理),棉花的含量應(yīng)當(dāng)在10-40%之間?,F(xiàn)在決定檢驗(yàn)15%,20%,25%,30%,35%這五種棉花含量水平。每種水平試驗(yàn)5種樣品。a=5, n1=n2=n3=n4=n5=5如何來安排實(shí)驗(yàn)?48實(shí)驗(yàn)編號棉花含量實(shí)驗(yàn)序號15%1234520%67891025%111213141530%161718192035%212223242549如何進(jìn)行實(shí)驗(yàn)?50隨機(jī)抽選序號進(jìn)行實(shí)驗(yàn)例如利用隨機(jī)數(shù)表選擇序號,
9、直到做完25個實(shí)驗(yàn)為止。之所以如此進(jìn)行,是為了防止未知的干擾因素對實(shí)驗(yàn)結(jié)果造成污染。因此即是進(jìn)行所謂的隨機(jī)化。如果依次按照1-25號做完實(shí)驗(yàn),會有什么后果 ?51為何說檢驗(yàn)若干個均值是否相等的恰當(dāng)方法是方差分析?例如前例檢驗(yàn)五個均值是否相等 u1=u2=u3=u4=u5一種做法是可以利用兩個獨(dú)立樣本的t檢驗(yàn)來檢驗(yàn)所有可能樣本對需要檢驗(yàn)多少次?假設(shè)檢驗(yàn)犯錯誤的概率大為增加:1-0.9510=1-0.60=0.40 52多重比較 在否定了原假設(shè)之后,并未明確指出哪些均值不同。此時需要進(jìn)一步比較各組均值之間的差異,即所謂的多重比較。需要檢驗(yàn) 個假設(shè):53最小顯著性差異法(LSD)545556雙邊檢驗(yàn)
10、,則當(dāng)就認(rèn)為 與 有顯著差異就是所謂的最小顯著性差異此時只需要將每對均值差的絕對值與LSD比較,如果大于LSD,就顯著。否則就不顯著。57LSD方法的問題可能極大地提高犯第一類錯誤的風(fēng)險;有時候方差分析的F值是顯著的,但利用LSD方法找不到任何有顯著差異的水平對。即有些差異不一定以兩個水平的均值之差表現(xiàn)出來。LSD方法與Duncan方法在眾多的多重比較方法中,功效是最強(qiáng)的。58正態(tài)性檢驗(yàn)正態(tài)概率紙法殘差圖法59正態(tài)概率紙法橫坐標(biāo)等間隔,表示觀察值大小;縱坐標(biāo)表示觀察值中不超過值x的數(shù)據(jù)個數(shù)占全部觀察值個數(shù)的比例;任意兩個方差相等的正態(tài)分布函數(shù)呈現(xiàn)平行的直線狀。60正態(tài)分布右偏分布左偏分布正態(tài)概率紙61具體操作檢驗(yàn)x1,x2,xm是否來自于正態(tài)總體的一個樣本。1)把樣本數(shù)據(jù)進(jìn)行排序x(1) x(2) x(m),一般要求m8。2)計(jì)算x(j)處的累積概率 用修正頻率 來估計(jì),計(jì)算出這些估計(jì)值3)把m個點(diǎn)x(j),j/(m+1)逐一點(diǎn)在正態(tài)概率紙張上。4)用目測判斷,若大致在一條直線周圍,則來自于正態(tài)總體,若非,則不是正態(tài)總體。62正態(tài)概率紙法的缺陷實(shí)驗(yàn)設(shè)計(jì)中,重復(fù)次數(shù)少于8的情形很多,此時單獨(dú)就每組樣本數(shù)據(jù)使用正態(tài)概率紙來檢驗(yàn),效果不好。容易判斷失誤;怎么辦63可行辦法一:匯總殘差項(xiàng)數(shù)把各組的殘差合并成一個大樣本之
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 油品儲運(yùn)調(diào)合工崗前工作質(zhì)量考核試卷含答案
- 物料輸送及煙氣凈化工安全規(guī)程測試考核試卷含答案
- 2025年東遼縣事業(yè)單位聯(lián)考招聘考試歷年真題附答案
- 2024年湖南九嶷職業(yè)技術(shù)學(xué)院馬克思主義基本原理概論期末考試題附答案
- 2024年溫州市工人業(yè)余大學(xué)馬克思主義基本原理概論期末考試題附答案
- 2024年運(yùn)城市特崗教師招聘考試真題匯編附答案
- 2024年萊蕪市直機(jī)關(guān)遴選公務(wù)員考試真題匯編附答案
- 2025年美容美甲行業(yè)操作規(guī)范手冊
- 2024年重慶化工職業(yè)學(xué)院馬克思主義基本原理概論期末考試題附答案
- 2025四川省公務(wù)員考試常識判斷專項(xiàng)練習(xí)題及答案1套
- 【語文】湖南省長沙市實(shí)驗(yàn)小學(xué)小學(xué)四年級上冊期末試卷(含答案)
- 阿米巴經(jīng)營模式-人人都是經(jīng)營者推行授課講義課件
- 小兒鞘膜積液
- 畢業(yè)設(shè)計(jì)粘土心墻土石壩設(shè)計(jì)含計(jì)算書cad圖
- 黑龍江省控制性詳細(xì)規(guī)劃編制規(guī)范
- 6工程竣工驗(yàn)收交付證明書
- 《俠客風(fēng)云傳前傳》支線流程攻略1.0.2.4
- GB/T 38937-2020鋼筋混凝土用鋼術(shù)語
- GB/T 12325-2008電能質(zhì)量供電電壓偏差
- 《抖音短視頻營銷存在的問題及對策10000字》
- 讀后續(xù)寫練習(xí)指導(dǎo) 講義(附試題分析及范文3篇)-2023高考英語二輪復(fù)習(xí)寫作備考
評論
0/150
提交評論