統(tǒng)計學(xué)-列聯(lián)分析與擬合優(yōu)度檢驗_第1頁
統(tǒng)計學(xué)-列聯(lián)分析與擬合優(yōu)度檢驗_第2頁
統(tǒng)計學(xué)-列聯(lián)分析與擬合優(yōu)度檢驗_第3頁
統(tǒng)計學(xué)-列聯(lián)分析與擬合優(yōu)度檢驗_第4頁
統(tǒng)計學(xué)-列聯(lián)分析與擬合優(yōu)度檢驗_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

列聯(lián)分析與擬合優(yōu)度檢驗第一節(jié)列聯(lián)表第二節(jié)獨立性檢驗與相關(guān)的度量第三節(jié)擬合優(yōu)度檢驗第一節(jié)列聯(lián)表1.列聯(lián)表與列聯(lián)分析如果用一個表格列出兩個變量交互決定的頻數(shù)分布,則稱之為交叉列表分析,也稱為列聯(lián)表分析、列聯(lián)分析。相關(guān)的表格可稱為交叉表或列聯(lián)表;交叉列表分析的主要目的,在于分析兩變量間的相互關(guān)系,即是否相互關(guān)聯(lián)(相互獨立)以及關(guān)聯(lián)的強度。

2.列聯(lián)表的基本形式列聯(lián)表所展示的是至少兩個變量的交叉頻數(shù)。表中的每個頻數(shù)均由兩個變量的值交互決定第一節(jié)列聯(lián)表2.列聯(lián)表的基本形式列聯(lián)表所展示的是至少兩個變量的交叉頻數(shù)。觀察表中的頻數(shù),可以大致判斷出兩個變量是否相關(guān)(或是否相互獨立)第一節(jié)列聯(lián)表cj總計rif11f12…f21

f22…………r1r2…總計c1c2…nr

行c列的列聯(lián)表列聯(lián)表的一般形式:第一節(jié)列聯(lián)表3.列聯(lián)分析的對象適合做列聯(lián)表分析的是首先是品質(zhì)變量,即定類、定序變量。取值較少的數(shù)量變量也可以做列聯(lián)分析。如果變量取值較多,無論品質(zhì)變量或數(shù)量變量,都不適合使用列聯(lián)分析。第一節(jié)列聯(lián)表4.列聯(lián)表的兩個分布:觀測值分布和期望值分布:格子中的觀測值分布與期望值分布總是有差異的。當(dāng)差異大到一定程度時,我們就認為兩變量是相互關(guān)聯(lián)的,即不相互獨立。第一節(jié)列聯(lián)表觀測值分布通常標(biāo)記為oij,期望值分布通常標(biāo)記為eij;期望分布的手工計算:第一節(jié)列聯(lián)表3.獨立性檢驗依據(jù)觀測分布與期望分布,可以計算卡方值,用來做獨立性檢驗:顯然,如果觀測分布與期望分布相同,則卡方值為0,兩變量相互獨立;而兩個分布相差越大,卡方值就越大,我們就越傾向于兩變量是相關(guān)的,即不相互獨立。第二節(jié)獨立性檢驗與相關(guān)的度量獨立性檢驗是右側(cè)檢驗,即對于給定的顯著性水平α,若計算得到的χ2

大于χ2

α,對應(yīng)的P值(即原假設(shè)成立時χ2分布中大于該χ2

值的概率)小于α,我們就要拒絕原假設(shè)。不能拒絕的情形拒絕的情形第二節(jié)獨立性檢驗與相關(guān)的度量前例國家與對他人態(tài)度的獨立性檢驗:如果設(shè)顯著性水平為0.05,則有:第二節(jié)獨立性檢驗與相關(guān)的度量4.對變量相關(guān)程度的度量對兩變量相互關(guān)系的研究,應(yīng)當(dāng)依次提出并解決四個問題:

第一,兩變量在數(shù)量上有關(guān)系嗎?

第二,這種關(guān)系強嗎?

第三,總體是否也是如此?

第四,是因果關(guān)系嗎?第二節(jié)獨立性檢驗與相關(guān)的度量觀察列聯(lián)表的觀測值分布與期望值分布,可以解決上述第一個問題,并且對關(guān)系強度有一個較為模糊的判斷。但是,如果要對關(guān)系強度做精確度量,就得計算相應(yīng)的度量值。變量類型不同,度量值的計算方法也不同。第二節(jié)獨立性檢驗與相關(guān)的度量自變量x定類(A)定序(B)定比(C)因變量y定類(A)A-AC-A定序(B)B-B定比(C)A-CC-CA-A屬于兩個定類變量的相關(guān)問題,一般也稱為品質(zhì)相關(guān)。反映關(guān)系強度的度量值為Φ系數(shù)、C系數(shù)、V系數(shù)等。第二節(jié)獨立性檢驗與相關(guān)的度量自變量x定類(A)定序(B)定比(C)因變量y定類(A)A-AC-A定序(B)B-B定比(C)A-CC-CB-B屬于兩個定序變量的相關(guān)問題,一般也稱為等級相關(guān)。反映相關(guān)強度的指標(biāo)為斯皮爾曼等級相關(guān)系數(shù)和肯達爾的一致性系數(shù)等。這些相關(guān)系數(shù)也稱為“秩相關(guān)系數(shù)”。第二節(jié)獨立性檢驗與相關(guān)的度量自變量x定類(A)定序(B)定比(C)因變量y定類(A)A-AC-A定序(B)B-B定比(C)A-CC-CC-C屬于兩個定比變量的相關(guān)問題。通常所說的相關(guān)分析即指這種情況。如果兩變量服從正態(tài)分布,可以用皮爾遜積矩相關(guān)系數(shù)描述關(guān)系強度;否則應(yīng)當(dāng)使用秩相關(guān)系數(shù)。第二節(jié)獨立性檢驗與相關(guān)的度量自變量x定類(A)定序(B)定比(C)因變量y定類(A)A-AC-A定序(B)B-B定比(C)A-CC-CA-C和C-A為一個定類變量與一個定比變量的相關(guān)問題??梢允褂肊ta統(tǒng)計量度量兩變量間的關(guān)系強度。第二節(jié)獨立性檢驗與相關(guān)的度量做列聯(lián)表分析時,上述相關(guān)系數(shù)都可能用到。但最常用的還是描述品質(zhì)相關(guān)和等級相關(guān)的系數(shù)。描述品質(zhì)相關(guān)強度的系數(shù)主要依據(jù)卡方值來計算:用于2行2列的正方表第二節(jié)獨立性檢驗與相關(guān)的度量做列聯(lián)表分析時,上述相關(guān)系數(shù)都可能用到。但最常用的還是描述品質(zhì)相關(guān)和等級相關(guān)的系數(shù)。描述品質(zhì)相關(guān)強度的系數(shù)主要依據(jù)卡方值來計算:用于3行3列及以上的正方表第二節(jié)獨立性檢驗與相關(guān)的度量做列聯(lián)表分析時,上述相關(guān)系數(shù)都可能用到。但最常用的還是描述品質(zhì)相關(guān)和等級相關(guān)的系數(shù)。描述品質(zhì)相關(guān)強度的系數(shù)主要依據(jù)卡方值來計算:是Φ系數(shù)的推廣。對于2行或2列的列聯(lián)表,V系數(shù)與Φ系數(shù)等價。第二節(jié)獨立性檢驗與相關(guān)的度量第二節(jié)獨立性檢驗與相關(guān)的度量Φ系數(shù)、c系數(shù)、V系數(shù)的值均在0到1之間,越接近于1表明關(guān)聯(lián)程度越強,反之則說明關(guān)聯(lián)程度弱。對前述例子中,“國家”與“對他人態(tài)度”均為定類變量且各有兩個取值,所構(gòu)建的是2行2列的正方表,故可以使用Φ系數(shù)關(guān)聯(lián)強度的度量:Φ系數(shù)的值域為0至1,越接近1表明關(guān)聯(lián)程度越高。在本例,可以認為兩變量具有中等的關(guān)聯(lián)強度。第二節(jié)獨立性檢驗與相關(guān)的度量描述等級相關(guān)強度的系數(shù)主要是斯皮爾曼相關(guān)系數(shù)和肯達爾的一致性系數(shù),它們均依據(jù)數(shù)據(jù)的“秩”即排序來計算:第二節(jié)獨立性檢驗與相關(guān)的度量描述等級相關(guān)強度的系數(shù)主要是斯皮爾曼相關(guān)系數(shù)和肯達爾的一致性系數(shù),它們均依據(jù)數(shù)據(jù)的“秩”即排序來計算:第二節(jié)獨立性檢驗與相關(guān)的度量描述等級相關(guān)強度的系數(shù)主要是斯皮爾曼相關(guān)系數(shù)和肯達爾的一致性系數(shù),它們均依據(jù)數(shù)據(jù)的“秩”即排序來計算:第二節(jié)獨立性檢驗與相關(guān)的度量斯皮爾曼相關(guān)系數(shù)和肯達爾的一致性系數(shù)均描述兩變量間的線性關(guān)聯(lián)強度;斯皮爾曼相關(guān)系數(shù)和肯達爾的一致性系數(shù)取值均在負1到1之間,絕對值域為0到1。系數(shù)絕對值越接近于1,表明關(guān)聯(lián)強度越高;定距、定比變量也可以計算斯皮爾曼相關(guān)系數(shù)或肯達爾的一致性系數(shù),只是需要將變量值轉(zhuǎn)化為排序。第二節(jié)獨立性檢驗與相關(guān)的度量看一個例子:2009年某地車險的市場占有情況如下表所示:第三節(jié)擬合優(yōu)度檢驗公司人保太保平保其他占有比例70%15%10%5%2010年,為爭奪市場,各公司紛紛加大營銷力度。一個由400份保單組成的樣本顯示:人保272份、太保60份、平保52份、其他16份。問題:2010年市場總體份額較上一年度是否發(fā)生了顯著變化?解決類似于這樣的問題,需要做擬合優(yōu)度檢驗1.什么是擬合優(yōu)度檢驗?擬合優(yōu)度檢驗是判斷是否拒絕總體服從假設(shè)的概率分布的統(tǒng)計檢驗方法。即:對總體的分布形式有一個假設(shè);但樣本分布形式與這個假設(shè)不相符;我們需要通過假設(shè)檢驗來判斷:樣本所來自的總體的分布形式是否與先前的假設(shè)不符。第三節(jié)擬合優(yōu)度檢驗1.什么是擬合優(yōu)度檢驗?如前例:2009年度該地車險市場的份額分布情況,可以視為是對2010年度市場總體分布形式的一個假設(shè);2010年度的樣本分布形式與這個假設(shè)不相符;我們需要通過假設(shè)檢驗來判斷:2010年度車險市場總體份額是否已經(jīng)較2009年度有顯著變化。第三節(jié)擬合優(yōu)度檢驗2.擬合優(yōu)度檢驗的基本過程提出假設(shè):第三節(jié)擬合優(yōu)度檢驗2.擬合優(yōu)度檢驗的基本過程計算檢驗統(tǒng)計量:第三節(jié)擬合優(yōu)度檢驗2.擬合優(yōu)度檢驗的基本過程確定拒絕規(guī)則。因卡方檢驗是右側(cè)檢驗,在右側(cè)有一個臨界值。設(shè)定顯著性水平后,即可確定該臨界值和拒絕規(guī)則:第三節(jié)擬合優(yōu)度檢驗3.幾個擬合優(yōu)度檢驗例題多項總體的擬合優(yōu)度檢驗:前述車險市場份額的例子(設(shè)顯著性水平為0.5)。

首先提出假設(shè):第三節(jié)擬合優(yōu)度檢驗3.幾個擬合優(yōu)度檢驗例題其次,確定臨界值:第三節(jié)擬合優(yōu)度檢驗3.幾個擬合優(yōu)度檢驗例題最后,計算并得出結(jié)論:第三節(jié)擬合優(yōu)度檢驗3.幾個擬合優(yōu)度檢驗例題二項總體的擬合優(yōu)度檢驗:某大學(xué)推行計算機課授課模式改革。改革前國家計算機二級考試的總體及格率為30%;改革后一個100人的樣本顯示:及格38人、不及格62人。試以0.05的顯著性水平檢驗:授課模式改革是否成功?第三節(jié)擬合優(yōu)度檢驗3.幾個擬合優(yōu)度檢驗例題首先,提出假設(shè):第三節(jié)擬合優(yōu)度檢驗3.幾個擬合優(yōu)度檢驗例題其次,確定臨界值:第三節(jié)擬合優(yōu)度檢驗3.幾個擬合優(yōu)度檢驗例題最后,計算并做出結(jié)論:第三節(jié)擬合優(yōu)度檢驗3.幾個擬合優(yōu)度檢驗例題正態(tài)總體的擬合優(yōu)度檢驗:考試成績的分布是否服從正態(tài)分布。某校一個由413名學(xué)生組成的樣本顯示,概率統(tǒng)計考試成績呈左偏態(tài)分布。因為學(xué)校要求考試分數(shù)應(yīng)呈正態(tài)分布,現(xiàn)需要檢驗該門課程考試成績總體分布是否符合學(xué)校的要求(顯著性水平為0.05)。第三節(jié)擬合優(yōu)度檢驗第三節(jié)擬合優(yōu)度檢驗第三節(jié)擬合優(yōu)度檢驗第一,計算樣本均值和標(biāo)準(zhǔn)差,并據(jù)此提出假設(shè)。第三節(jié)擬合優(yōu)度檢驗第二,確定原假設(shè)成立時正態(tài)分布概率密度曲線下的等概率區(qū)間。如果將全部413人分為10組,則每組有41.3人,各占據(jù)對應(yīng)的正態(tài)概率密度曲線下10%的面積:第三節(jié)擬合優(yōu)度檢驗第三,根據(jù)標(biāo)準(zhǔn)正態(tài)分布表或使用其他工具,確定正態(tài)分布概率密度曲線下等概率區(qū)間邊界對應(yīng)的Z值。區(qū)間邊界Z值區(qū)間邊界Z值最低10%-1.28最高40%0.25最低20%-0.84最高30%0.52最低30%-0.52最高20%0.84最低40%-0.25最高10%1.28中間分數(shù)0第三節(jié)擬合優(yōu)度檢驗第四,計算等概率區(qū)間邊界對應(yīng)的分數(shù)。區(qū)間邊界分數(shù)區(qū)間邊界分數(shù)最低10%45.99最高40%77.4最低20%55.02最高30%82.94最低30%61.59最高20%89.51最低40%67.13最高10%98.54中間分數(shù)72.27第三節(jié)擬合優(yōu)度檢驗465662687378839099N(μ=72.266,σ=20.5297)等概率區(qū)間邊界對應(yīng)的分數(shù)。第三節(jié)擬合優(yōu)度檢驗第五,列出等概率區(qū)間的實際、期望頻數(shù)。分數(shù)區(qū)間實際頻數(shù)期望頻數(shù)0~464741.346~561541.356~624041.362~683341.368~733041.373~784041.378~834441.38

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論