《統(tǒng)計學-SPSS和Excel實現(xiàn)》(第9版)課件 第7章 類別變量分析_第1頁
《統(tǒng)計學-SPSS和Excel實現(xiàn)》(第9版)課件 第7章 類別變量分析_第2頁
《統(tǒng)計學-SPSS和Excel實現(xiàn)》(第9版)課件 第7章 類別變量分析_第3頁
《統(tǒng)計學-SPSS和Excel實現(xiàn)》(第9版)課件 第7章 類別變量分析_第4頁
《統(tǒng)計學-SPSS和Excel實現(xiàn)》(第9版)課件 第7章 類別變量分析_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計學SPSS和Excel實現(xiàn)(第9版)賈俊平著課程內容描述統(tǒng)計、推斷統(tǒng)計、其他方法使用軟件SPSS和Excel學分與課時

3學分,1~17周,每周

3課時課程簡介中國人民大學出版社高等教育經濟管理類核心課程教材北京高等學校優(yōu)質本科教材課程北京高等教育精品教材“十二五”普通高等教育本科國家級教材賈俊平2025/9/107.1一個類別變量的擬合優(yōu)度檢驗7.2兩個類別變量的獨立性檢驗7.3兩個類別變量的相關性度量

第7章類別變量分析類別變量推斷一個類別變量擬合優(yōu)度檢驗期望頻數(shù)相等期望頻數(shù)不等兩個類別變量獨立性檢驗不拒絕原假設拒絕原假設相關性度量Phi系數(shù)克萊姆V系數(shù)列聯(lián)系數(shù)獨立性相關性擬合優(yōu)度思維導圖思考以下問題讀完四年大學,一次課也沒有逃過,這樣的學生恐怕不多。中國人民大學財政金融學院的學生就逃課問題做了一次調查,調查的對象是財政金融學院的大一、大二、大三本科生。樣本的抽取方式是分層抽樣與簡單隨機抽樣結合,先根據(jù)年級劃分層次,然后對各個班級作簡單隨機抽樣,共抽取150名學生組成一個樣本,然后對每個學生采用問卷調查。問卷內容包括是否逃過課、每周逃課次數(shù)、所逃課程的類型(選修課、專業(yè)課等)和逃課原因等。調查得到的男女學生逃課情況的匯總表如下這里涉及兩個類別變量,一個是是否逃課,一個是性別。根據(jù)上面的數(shù)據(jù),你認為性別與是否逃課有關系嗎?如何來檢驗兩個類別變量之間是否存在關系呢?學完本章內容就很容易解決這樣的問題是否逃課男女合計逃過課343872未逃過課285078合計6288150性別與是否逃課有關系嗎期望頻數(shù)相等利用Pearson-2統(tǒng)計量來判斷某個類別變量各類別的觀察頻數(shù)分布與某一理論分布或期望分布是否一致的檢驗方法比如,各月份的產品銷售量是否符合均勻分布不同地區(qū)的離婚率是否有顯著差異也稱為一致性檢驗(testofhomogeneity)該檢驗也可用于判斷各類別的觀察頻數(shù)分布是否符合泊松分布或正態(tài)分布等

7.1一個類別變量的擬合優(yōu)度檢驗期望頻數(shù)相等——例題分析【例7-1】為研究消費者對不同品牌的牛奶是否有明顯偏好,一家調查公司抽樣調查了500個消費者對4種品牌的偏好情況,得到的結果如

偏好的品牌人數(shù)A150B180C90D80合計500品牌觀察頻數(shù)fo期望頻數(shù)fe(fo-fe)2/feA1501255.0B18012524.2C901259.8D8012516.2合計50050055.27.1一個類別變量的擬合優(yōu)度檢驗期望頻數(shù)相等——例題分析——SPSS實現(xiàn)【例7-1】——SPSS輸出7.1一個類別變量的擬合優(yōu)度檢驗人數(shù)

實測個案數(shù)期望個案數(shù)殘差8080125.0-45.09090125.0-35.0150150125.025.0180180125.055.0總計500

檢驗統(tǒng)計

人數(shù)卡方55.200a自由度3漸近顯著性.0000個單元格(0.0%)的期望頻率低于5期望的最低單元格頻率為125.0。期望頻數(shù)不相等——例題分析【例7-2】——一項針對全國的住房價格調查表明,城鎮(zhèn)居民對房價表示非常不滿意的占15%,不滿意的占45%,一般的占25%,滿意的占9%,非常滿意的占6%。為研究一線大城市的居民對住房價格的滿意程度,一家研究機構在某城市抽樣調查300人,其中的一個問題是:“您對目前的住房價格是否滿意?”調查共設非常不滿意、不滿意、一般、滿意、非常滿意5個選項。調查結果的頻數(shù)分布如表7-5所示。檢驗該城市居民對住房價格滿意度評價的頻數(shù)與全國的評價頻數(shù)是否一致(α=0.05)

7.1一個類別變量的擬合優(yōu)度檢驗回答類別人數(shù)非常不滿意36不滿意126一般81滿意30非常滿意27合計300期望頻數(shù)不相等——例題分析——統(tǒng)計量的計算【例7-2】回答類別觀察頻數(shù)期望比例(%)期望頻數(shù)=期望比例×樣本量非常不滿意36150.15×300=45不滿意126450.45×300=135一般81250.25×300=75滿意3090.09×300=27非常滿意2760.06×300=18合計300100300回答類別觀察頻數(shù)fo期望頻數(shù)fe(fo-fe)2/fe非常不滿意36451.800不滿意1261350.600一般81750.480滿意30270.333非常滿意27184.500合計3003007.713SPSS輸出7.1一個類別變量的擬合優(yōu)度檢驗人數(shù)

實測個案數(shù)期望個案數(shù)殘差272718.09.0303027.03.0363645.0-9.0818175.06.0126126135.0-9.0總計300

檢驗統(tǒng)計

人數(shù)卡方7.713a自由度4漸近顯著性.103a.0個單元格(0.0%)的期望頻率低于5。期望的最低單元格頻率為18.0。獨立性檢驗研究兩個類別變量時,每個變量有多個類別,通常將兩個變量多個類別的頻數(shù)用交叉表的形式表示出來一個變量放在行(row)的位置,稱為行變量,其類別數(shù)(行數(shù))用r表示另一個變量放在列(column)的位置,稱為列變量,其類別數(shù)(列數(shù))用c表示這種由兩個或兩個以上類別變量交叉分類的頻數(shù)分布表稱為列聯(lián)表(contingencytable)一個由r行和c列組成的列聯(lián)表也稱為r

c列聯(lián)表例如,本章開頭的案例中,行變量“逃課情況”有兩個類別,列變量“性別”也有兩個類別,這就是一個2

2列聯(lián)表對列聯(lián)表中的兩個類別變量進行分析,通常是判斷兩個變量是否獨立該檢驗的原假設是:兩個變量獨立(無關)如果原假設被拒絕,則表明兩個變量不獨立,或者說兩個變量相關獨立性檢驗的統(tǒng)計量為

7.2兩個類別變量的獨立性檢驗獨立性檢驗——例題分析——期望頻數(shù)計算【例7-3】利用本章開頭關于學生逃課情況調查的數(shù)據(jù),能否認為性別與是否逃課獨立(α=0.05)解:第1步:提出假設H0:性別與是否逃課獨立H1:性別與是否逃課不獨立

第2步:計算期望頻數(shù)和檢驗統(tǒng)計量是否逃課男女合計逃過課343872未逃過課285078合計6288150是否逃課男女合計逃過課34(29.76)38(42.24)72未逃過課28(32.24)50(45.76)78合計6288150第3步:做出決策。由于自由度為(2-1)(2-1)=1,根據(jù)Excel中的【CHISQ.DIST.RT】函數(shù)計算的χ2統(tǒng)計量的P值(右尾概率)為0.159372,由于P值大于0.05,不拒絕原假設,可以認為性別與是否逃課獨立,或者說,性別與是否逃課無關7.2兩個類別變量的獨立性檢驗獨立性檢驗——例題分析——SPSS實現(xiàn)【例7-3】——SPSS輸出7.2兩個類別變量的獨立性檢驗是否逃課*性別交叉表

性別總計男女是否逃課逃過課計數(shù)343872期望計數(shù)29.842.272.0未逃過課計數(shù)285078期望計數(shù)32.245.878.0總計計數(shù)6288150期望計數(shù)62.088.0150.0卡方檢驗

值自由度漸進顯著性(雙側)精確顯著性(雙側)精確顯著性(單側)

皮爾遜卡方1.980a1.159

連續(xù)性修正b1.5411.215

似然比1.9831.159

費希爾精確檢驗

.186.107有效個案數(shù)150

a.0個單元格(0.0%)的期望計數(shù)小于5。最小期望計數(shù)為29.76。b.僅針對2x2表進行計算獨立性檢驗——注意事項在應用

2檢驗時,要求樣本量應足夠大,特別是每個單元格的期望頻數(shù)不能太小,否則應用應檢驗可能會得出錯誤的結論從

2統(tǒng)計量的公式可以看出,期望頻數(shù)在公式的分母上,如果某個單元格的期望頻數(shù)過小,統(tǒng)計量的值就會變大,從而導致拒絕原假設應用

2檢驗時對單元格的期望頻數(shù)有以下要求如果僅有兩個單元格,單元格的最小期望頻數(shù)不應小于5。否則不能進行

2檢驗單元格在兩個以上時,期望頻數(shù)小于5的單元格不能超過總格子數(shù)的20%,否則不能進行

2檢驗如果出現(xiàn)期望頻數(shù)小于5的單元格超過20%,可以采取合并類別的辦法來解決這一問題7.2兩個類別變量的獨立性檢驗相關性度量

系數(shù)主要用于2

2列聯(lián)表的相關性測量。計算公式克萊姆V系數(shù)由Cramer提出,計算公式

列聯(lián)系數(shù)主要用于大于2

2列聯(lián)表的相關性測量,用C表示。計算公式為聯(lián)系數(shù)不可能大于1。當兩個變量獨立時,C=0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論