2025年統(tǒng)計(jì)學(xué)期末考試:卡方檢驗(yàn)與統(tǒng)計(jì)推斷的實(shí)踐運(yùn)用試題_第1頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試:卡方檢驗(yàn)與統(tǒng)計(jì)推斷的實(shí)踐運(yùn)用試題_第2頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試:卡方檢驗(yàn)與統(tǒng)計(jì)推斷的實(shí)踐運(yùn)用試題_第3頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試:卡方檢驗(yàn)與統(tǒng)計(jì)推斷的實(shí)踐運(yùn)用試題_第4頁(yè)
2025年統(tǒng)計(jì)學(xué)期末考試:卡方檢驗(yàn)與統(tǒng)計(jì)推斷的實(shí)踐運(yùn)用試題_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025年統(tǒng)計(jì)學(xué)期末考試:卡方檢驗(yàn)與統(tǒng)計(jì)推斷的實(shí)踐運(yùn)用試題考試時(shí)間:______分鐘總分:______分姓名:______一、選擇題(本大題共20小題,每小題2分,共40分。在每小題列出的四個(gè)選項(xiàng)中,只有一項(xiàng)是最符合題目要求的,請(qǐng)將正確選項(xiàng)字母填在題后的括號(hào)內(nèi)。)1.在進(jìn)行卡方檢驗(yàn)時(shí),如果觀測(cè)頻數(shù)與期望頻數(shù)的差異很大,那么通常意味著什么?A.數(shù)據(jù)存在系統(tǒng)性偏差B.樣本量太小C.檢驗(yàn)假設(shè)不成立D.數(shù)據(jù)存在隨機(jī)誤差2.下列哪種情況適合使用卡方擬合優(yōu)度檢驗(yàn)?A.比較兩個(gè)獨(dú)立樣本的均值差異B.檢驗(yàn)一個(gè)樣本的分布是否符合某個(gè)理論分布C.分析兩個(gè)分類變量之間的相關(guān)性D.比較兩個(gè)配對(duì)樣本的均值差異3.在卡方獨(dú)立性檢驗(yàn)中,自由度的計(jì)算公式是什么?A.(行數(shù)-1)×(列數(shù)-1)B.行數(shù)+列數(shù)-1C.行數(shù)×列數(shù)D.(行數(shù)+列數(shù))÷24.當(dāng)卡方檢驗(yàn)的P值小于顯著性水平時(shí),通常應(yīng)該怎么解釋?A.拒絕原假設(shè)B.接受原假設(shè)C.檢驗(yàn)無效D.需要更大的樣本量5.在進(jìn)行卡方檢驗(yàn)時(shí),期望頻數(shù)的計(jì)算通?;谑裁矗緼.觀測(cè)頻數(shù)B.理論分布C.樣本均值D.樣本標(biāo)準(zhǔn)差6.如果一個(gè)研究者在進(jìn)行卡方檢驗(yàn)時(shí)發(fā)現(xiàn)自由度為0,那么這意味著什么?A.數(shù)據(jù)無法進(jìn)行卡方檢驗(yàn)B.所有觀測(cè)頻數(shù)都相等C.樣本量太小D.檢驗(yàn)假設(shè)不成立7.在卡方擬合優(yōu)度檢驗(yàn)中,如果P值很大,那么通常意味著什么?A.數(shù)據(jù)符合理論分布B.數(shù)據(jù)不符合理論分布C.檢驗(yàn)無效D.需要更大的樣本量8.在進(jìn)行卡方獨(dú)立性檢驗(yàn)時(shí),如果發(fā)現(xiàn)某個(gè)單元格的期望頻數(shù)小于5,那么通常應(yīng)該怎么處理?A.忽略該單元格B.合并該單元格C.增加樣本量D.使用其他檢驗(yàn)方法9.在卡方檢驗(yàn)中,為什么自由度的計(jì)算很重要?A.它決定了檢驗(yàn)的復(fù)雜性B.它影響了P值的計(jì)算C.它決定了檢驗(yàn)的準(zhǔn)確性D.它影響了檢驗(yàn)的顯著性水平10.在進(jìn)行卡方擬合優(yōu)度檢驗(yàn)時(shí),如果理論分布不正確,那么通常會(huì)導(dǎo)致什么后果?A.P值增大B.P值減小C.檢驗(yàn)無效D.需要更大的樣本量11.在卡方獨(dú)立性檢驗(yàn)中,如果兩個(gè)分類變量之間存在很強(qiáng)的相關(guān)性,那么通常意味著什么?A.卡方檢驗(yàn)的結(jié)果不可靠B.卡方檢驗(yàn)的結(jié)果更可靠C.需要使用其他檢驗(yàn)方法D.數(shù)據(jù)存在系統(tǒng)性偏差12.當(dāng)卡方檢驗(yàn)的P值等于顯著性水平時(shí),通常應(yīng)該怎么解釋?A.拒絕原假設(shè)B.接受原假設(shè)C.檢驗(yàn)無效D.需要更大的樣本量13.在進(jìn)行卡方檢驗(yàn)時(shí),為什么樣本量的大小很重要?A.它影響了檢驗(yàn)的準(zhǔn)確性B.它決定了檢驗(yàn)的顯著性水平C.它影響了P值的計(jì)算D.它決定了檢驗(yàn)的復(fù)雜性14.在卡方擬合優(yōu)度檢驗(yàn)中,如果P值小于顯著性水平,那么通常應(yīng)該怎么解釋?A.數(shù)據(jù)符合理論分布B.數(shù)據(jù)不符合理論分布C.檢驗(yàn)無效D.需要更大的樣本量15.在進(jìn)行卡方獨(dú)立性檢驗(yàn)時(shí),如果發(fā)現(xiàn)某個(gè)單元格的觀測(cè)頻數(shù)與期望頻數(shù)差異很大,那么通常應(yīng)該怎么處理?A.忽略該單元格B.合并該單元格C.增加樣本量D.使用其他檢驗(yàn)方法16.在卡方檢驗(yàn)中,為什么顯著性水平的選擇很重要?A.它影響了檢驗(yàn)的準(zhǔn)確性B.它決定了檢驗(yàn)的顯著性水平C.它影響了P值的計(jì)算D.它決定了檢驗(yàn)的復(fù)雜性17.在卡方擬合優(yōu)度檢驗(yàn)中,如果理論分布是正態(tài)分布,那么通常應(yīng)該怎么驗(yàn)證?A.使用直方圖B.使用Q-Q圖C.使用卡方檢驗(yàn)D.使用t檢驗(yàn)18.在進(jìn)行卡方獨(dú)立性檢驗(yàn)時(shí),如果兩個(gè)分類變量之間不存在相關(guān)性,那么通常意味著什么?A.卡方檢驗(yàn)的結(jié)果不可靠B.卡方檢驗(yàn)的結(jié)果更可靠C.需要使用其他檢驗(yàn)方法D.數(shù)據(jù)存在系統(tǒng)性偏差19.在卡方檢驗(yàn)中,為什么期望頻數(shù)的計(jì)算很重要?A.它決定了檢驗(yàn)的復(fù)雜性B.它影響了P值的計(jì)算C.它決定了檢驗(yàn)的準(zhǔn)確性D.它影響了檢驗(yàn)的顯著性水平20.在進(jìn)行卡方擬合優(yōu)度檢驗(yàn)時(shí),如果P值大于顯著性水平,那么通常應(yīng)該怎么解釋?A.數(shù)據(jù)符合理論分布B.數(shù)據(jù)不符合理論分布C.檢驗(yàn)無效D.需要更大的樣本量二、填空題(本大題共10小題,每小題2分,共20分。請(qǐng)將答案填寫在題中的橫線上。)1.在卡方檢驗(yàn)中,自由度的計(jì)算公式是________。2.當(dāng)卡方檢驗(yàn)的P值小于顯著性水平時(shí),通常應(yīng)該________。3.在進(jìn)行卡方擬合優(yōu)度檢驗(yàn)時(shí),期望頻數(shù)的計(jì)算通?;赺_______。4.在卡方獨(dú)立性檢驗(yàn)中,如果發(fā)現(xiàn)某個(gè)單元格的期望頻數(shù)小于5,那么通常應(yīng)該________。5.在卡方檢驗(yàn)中,為什么自由度的計(jì)算很重要?因?yàn)開_______。6.在進(jìn)行卡方擬合優(yōu)度檢驗(yàn)時(shí),如果理論分布不正確,那么通常會(huì)導(dǎo)致________。7.在卡方獨(dú)立性檢驗(yàn)中,如果兩個(gè)分類變量之間存在很強(qiáng)的相關(guān)性,那么通常意味著________。8.當(dāng)卡方檢驗(yàn)的P值等于顯著性水平時(shí),通常應(yīng)該________。9.在進(jìn)行卡方檢驗(yàn)時(shí),為什么樣本量的大小很重要?因?yàn)開_______。10.在卡方檢驗(yàn)中,為什么顯著性水平的選擇很重要?因?yàn)開_______。(請(qǐng)注意,以上內(nèi)容僅為示例,實(shí)際考試中應(yīng)根據(jù)具體教學(xué)內(nèi)容和范圍進(jìn)行調(diào)整。)三、簡(jiǎn)答題(本大題共5小題,每小題4分,共20分。請(qǐng)將答案寫在答題紙上,不必抄寫題干。)1.簡(jiǎn)述卡方擬合優(yōu)度檢驗(yàn)的基本原理和應(yīng)用場(chǎng)景。在課堂上,我曾拿著一個(gè)骰子舉例,問大家這骰子是不是公平的。我們擲了100次,記錄每個(gè)點(diǎn)數(shù)出現(xiàn)的次數(shù)。這時(shí)候,如果骰子是公平的,那么每個(gè)點(diǎn)數(shù)出現(xiàn)的次數(shù)應(yīng)該差不多,比如每個(gè)點(diǎn)數(shù)出現(xiàn)20次左右??ǚ綌M合優(yōu)度檢驗(yàn)就是用來判斷觀測(cè)到的頻率分布是否符合某個(gè)預(yù)期的理論分布,比如公平骰子的每個(gè)點(diǎn)數(shù)出現(xiàn)次數(shù)都相等。它通過計(jì)算觀測(cè)頻數(shù)和期望頻數(shù)之間的差異,來看這些差異是否足夠大以至于不能歸因于隨機(jī)波動(dòng)。應(yīng)用場(chǎng)景很廣,比如檢驗(yàn)生產(chǎn)的產(chǎn)品的合格率是否符合預(yù)期,調(diào)查的結(jié)果是否符合某個(gè)理論分布等等。2.解釋卡方獨(dú)立性檢驗(yàn)中的期望頻數(shù)是什么,以及為什么有時(shí)候需要合并單元格。在講解期望頻數(shù)時(shí),我通常會(huì)畫一個(gè)列聯(lián)表。期望頻數(shù)就是在假設(shè)兩個(gè)分類變量相互獨(dú)立的情況下,根據(jù)總樣本量和各個(gè)分類的邊際總和計(jì)算出來的“預(yù)期”頻數(shù)。它就像一個(gè)理論上的平均值,告訴我們?nèi)绻麅蓚€(gè)變量真的沒關(guān)系,那么每個(gè)單元格里大概應(yīng)該有多少人。比如,如果我們調(diào)查吸煙和是否患肺癌的關(guān)系,期望頻數(shù)就是根據(jù)總吸煙人數(shù)、總不吸煙人數(shù)、總患肺癌人數(shù)和總沒患肺癌人數(shù)計(jì)算出來的,假設(shè)吸煙與否不影響患肺癌的概率。而合并單元格通常是因?yàn)槟硞€(gè)單元格的期望頻數(shù)太小,小于5(有時(shí)是1)這個(gè)閾值。太小的話,卡方統(tǒng)計(jì)量的計(jì)算就會(huì)不太穩(wěn)定,結(jié)果也不太可靠,這時(shí)候把相鄰的單元格合并起來,可以增大期望頻數(shù),使檢驗(yàn)更有效。3.描述在進(jìn)行卡方檢驗(yàn)時(shí),如何判斷樣本量是否足夠大。講到樣本量的時(shí)候,我強(qiáng)調(diào)過,樣本量不夠大,檢驗(yàn)結(jié)果就很難有說服力。雖然卡方檢驗(yàn)本身對(duì)樣本量的要求不像t檢驗(yàn)或方差分析那么嚴(yán)格,但總得有個(gè)大致的把握。一個(gè)常用的經(jīng)驗(yàn)法則是,對(duì)于2x2的列聯(lián)表,每個(gè)單元格的期望頻數(shù)都不應(yīng)該太小,最好是大于等于5。如果有些單元格期望頻數(shù)小于5,但大于等于1,并且單元格總數(shù)不多,可以考慮繼續(xù)分析,但最好報(bào)告一下這種情況。對(duì)于更大的表格,至少應(yīng)該大部分單元格的期望頻數(shù)大于等于5,而且沒有很多單元格的期望頻數(shù)非常小。總的來說,樣本量越大,檢驗(yàn)結(jié)果越可靠,但也并非絕對(duì),關(guān)鍵還是看數(shù)據(jù)本身和期望頻數(shù)的分布情況。4.比較卡方擬合優(yōu)度檢驗(yàn)和卡方獨(dú)立性檢驗(yàn)的異同點(diǎn)。這兩個(gè)檢驗(yàn)都基于卡方分布,都用來處理分類數(shù)據(jù),但目的不同。擬合優(yōu)度檢驗(yàn)是看單個(gè)分類變量的觀測(cè)分布是否符合某個(gè)理論分布,回答的是“這個(gè)分布對(duì)嗎?”的問題。獨(dú)立性檢驗(yàn)是看兩個(gè)分類變量之間是否存在關(guān)聯(lián),回答的是“這兩個(gè)變量有關(guān)系嗎?”的問題。比如,擬合優(yōu)度可以檢驗(yàn)生產(chǎn)的燈泡壽命是否服從正態(tài)分布,獨(dú)立性檢驗(yàn)可以檢驗(yàn)性別和喜好是否有關(guān)聯(lián)。在計(jì)算上,擬合優(yōu)度檢驗(yàn)只有一個(gè)總體,計(jì)算每個(gè)類別的期望頻數(shù);獨(dú)立性檢驗(yàn)涉及兩個(gè)變量,計(jì)算列聯(lián)表中每個(gè)單元格的期望頻數(shù)。它們的自由度計(jì)算方式也不同,擬合優(yōu)度是(類別數(shù)-1),獨(dú)立性是(行數(shù)-1)×(列數(shù)-1)。5.舉例說明在實(shí)際研究中,卡方檢驗(yàn)可能遇到的問題以及如何解決。在實(shí)際研究里,卡方檢驗(yàn)也不是萬(wàn)能的。比如,我曾經(jīng)遇到一個(gè)研究,想看不同年齡段的學(xué)生對(duì)某個(gè)問題的選擇是否有差異。數(shù)據(jù)整理成列聯(lián)表后,發(fā)現(xiàn)有些單元格的期望頻數(shù)特別小,小于5。這時(shí)候,如果強(qiáng)行做卡方檢驗(yàn),結(jié)果可能不靠譜。解決方法有幾種:一是增加樣本量,讓期望頻數(shù)變大;二是合并一些單元格,比如把年齡分段合并得更粗一些,但要小心不能合并掉有意義的差異;三是使用Fisher精確檢驗(yàn),這個(gè)方法不依賴大樣本近似,適用于小樣本或期望頻數(shù)很小的情況;四是考慮使用其他方法,比如針對(duì)有序分類變量的Mantel-Haenszel檢驗(yàn)等。四、計(jì)算題(本大題共3小題,每小題10分,共30分。請(qǐng)將計(jì)算步驟和答案寫在答題紙上。)1.某研究者調(diào)查了100名大學(xué)生對(duì)兩門課程(A和B)的滿意度(滿意、一般、不滿意),結(jié)果如下表所示。假設(shè)滿意度在兩門課程之間沒有差異,試進(jìn)行卡方獨(dú)立性檢驗(yàn)(顯著性水平α=0.05)。||課程A|課程B|合計(jì)||:--------|:----|:----|:---||滿意|30|40|70||一般|20|15|35||不滿意|10|15|25||合計(jì)|60|70|130|(計(jì)算過程:首先,計(jì)算每個(gè)單元格的期望頻數(shù)。比如,滿意且選擇課程A的期望頻數(shù)是(70×60)/130≈32.31。然后,計(jì)算每個(gè)單元格的(觀測(cè)頻數(shù)-期望頻數(shù))2/期望頻數(shù)。最后,將這些值加起來得到卡方統(tǒng)計(jì)量χ2。根據(jù)自由度(行數(shù)-1)×(列數(shù)-1)=2×2=4,查找卡方分布表,找到α=0.05時(shí)的臨界值,與計(jì)算出的χ2比較,判斷是否拒絕原假設(shè)。)2.一個(gè)工廠生產(chǎn)某種產(chǎn)品,理論上紅、黃、藍(lán)三種顏色的產(chǎn)品比例應(yīng)該是3:2:1。隨機(jī)抽取了200件產(chǎn)品,實(shí)際檢測(cè)到的顏色分布為紅75件、黃50件、藍(lán)75件。試進(jìn)行卡方擬合優(yōu)度檢驗(yàn)(顯著性水平α=0.01),判斷實(shí)際產(chǎn)品顏色分布是否符合理論比例。(計(jì)算過程:首先,計(jì)算每種顏色的期望頻數(shù)。比如,紅色期望頻數(shù)是200×(3/6)=100。然后,計(jì)算每個(gè)類別的(觀測(cè)頻數(shù)-期望頻數(shù))2/期望頻數(shù)。最后,將這些值加起來得到卡方統(tǒng)計(jì)量χ2。根據(jù)自由度(類別數(shù)-1)=3-1=2,查找卡方分布表,找到α=0.01時(shí)的臨界值,與計(jì)算出的χ2比較,判斷是否拒絕原假設(shè)。)3.某醫(yī)生想知道某種藥物對(duì)治療兩種不同類型的疾?。膊?和疾病2)是否有效。他記錄了用藥后治愈和未治愈的人數(shù),數(shù)據(jù)如下表所示。試進(jìn)行卡方獨(dú)立性檢驗(yàn)(顯著性水平α=0.10),判斷藥物對(duì)兩種疾病的治療效果是否有差異。||疾病1|疾病2|合計(jì)||:--------|:----|:----|:---||治愈|30|45|75||未治愈|70|55|125||合計(jì)|100|100|200|(計(jì)算過程:首先,計(jì)算每個(gè)單元格的期望頻數(shù)。比如,治愈且患有疾病1的期望頻數(shù)是(75×100)/200=37.5。然后,計(jì)算每個(gè)單元格的(觀測(cè)頻數(shù)-期望頻數(shù))2/期望頻數(shù)。最后,將這些值加起來得到卡方統(tǒng)計(jì)量χ2。根據(jù)自由度(行數(shù)-1)×(列數(shù)-1)=1×1=1,查找卡方分布表,找到α=0.10時(shí)的臨界值,與計(jì)算出的χ2比較,判斷是否拒絕原假設(shè)。)五、論述題(本大題共2小題,每小題15分,共30分。請(qǐng)將答案寫在答題紙上,要條理清晰,論點(diǎn)明確。)1.結(jié)合你自己的理解,談?wù)効ǚ綑z驗(yàn)在社會(huì)科學(xué)研究中的重要性,并舉例說明其應(yīng)用。在社會(huì)科學(xué)里,我們經(jīng)常遇到各種分類數(shù)據(jù),比如人們的觀點(diǎn)、態(tài)度、行為、背景信息等等。卡方檢驗(yàn)就像一個(gè)得力的助手,幫我們分析這些分類數(shù)據(jù)里是不是藏著什么有趣的模式或關(guān)系。它的重要性體現(xiàn)在哪兒呢?首先,它簡(jiǎn)單直觀,不需要像回歸分析那樣假設(shè)數(shù)據(jù)符合正態(tài)分布,對(duì)數(shù)據(jù)的要求相對(duì)寬松,很多調(diào)查數(shù)據(jù)、分類記錄都可以用。其次,它能回答我們關(guān)心的問題,比如不同性別的人對(duì)某項(xiàng)政策的支持率有沒有差異?不同教育程度的人的消費(fèi)習(xí)慣是否不同?這些都可以用卡方獨(dú)立性檢驗(yàn)來探索。舉個(gè)例子,我之前參與過一個(gè)關(guān)于城市居民出行方式的研究,我們收集了居民的年齡、居住地(市區(qū)/郊區(qū))、出行方式(公交/地鐵/自駕)等數(shù)據(jù)。用卡方檢驗(yàn)可以分析年齡和出行方式之間有沒有關(guān)聯(lián),比如是不是年輕人更傾向于用地鐵,或者市區(qū)居民更可能自駕。這種分析幫助我們理解了城市生活的不同側(cè)面,為城市規(guī)劃提供建議??ǚ綑z驗(yàn)通過揭示分類變量間的關(guān)聯(lián),為我們理解復(fù)雜的社會(huì)現(xiàn)象提供了基礎(chǔ)。2.試述在進(jìn)行卡方檢驗(yàn)時(shí),可能遇到的各種問題,以及針對(duì)這些問題可以采取的應(yīng)對(duì)策略。做卡方檢驗(yàn)的時(shí)候,我們也不能想當(dāng)然,有時(shí)候會(huì)遇到一些小麻煩。一個(gè)常見的問題是期望頻數(shù)太小。就像前面說的,如果2x2表中某個(gè)單元格的期望頻數(shù)小于5,或者更大表格中有很多單元格小于5,卡方檢驗(yàn)的結(jié)論就不太可靠了。這時(shí)候怎么辦呢?首先,最好的辦法是想辦法增加樣本量,讓期望頻數(shù)變大。如果不行,可以考慮合并一些行或列,把相關(guān)的單元格合并在一起,前提是不能丟失重要的信息,并且合并后的單元格里的數(shù)據(jù)在邏輯上是有意義的。比如,調(diào)查不同年齡段對(duì)某事的看法,如果青少年組和兒童組期望頻數(shù)都太小,可以考慮把這兩組合并成“年輕群體”。還有一種情況是樣本量過大,有時(shí)候即使期望頻數(shù)不小,但樣本量極大,微小的差異也可能被檢測(cè)出來,導(dǎo)致總是拒絕原假設(shè)。這時(shí)候需要考慮效應(yīng)量,也就是差異的大小,而不僅僅是P值。另外,卡方檢驗(yàn)假設(shè)數(shù)據(jù)是隨機(jī)抽樣得到的,而且分類是相互獨(dú)立的。如果數(shù)據(jù)不是隨機(jī)抽樣,或者存在重復(fù)測(cè)量、關(guān)聯(lián)樣本的情況,直接用卡方檢驗(yàn)可能就不對(duì)了,這時(shí)可以考慮使用Fisher精確檢驗(yàn)或者針對(duì)有序分類數(shù)據(jù)的非參數(shù)檢驗(yàn)方法??傊?,用卡方檢驗(yàn)前,要仔細(xì)檢查數(shù)據(jù),看是否符合假設(shè),如果不符合,就要靈活選用其他方法,或者對(duì)結(jié)果進(jìn)行謹(jǐn)慎解釋。本次試卷答案如下一、選擇題答案及解析1.A解析:卡方檢驗(yàn)的核心是檢驗(yàn)觀測(cè)頻數(shù)與期望頻數(shù)之間的差異是否顯著。如果差異很大,通常表明真實(shí)情況與我們的理論假設(shè)(比如獨(dú)立、符合某分布)有出入,這種差異往往是系統(tǒng)性的,而不是隨機(jī)誤差或抽樣波動(dòng)可以解釋的。2.B解析:卡方擬合優(yōu)度檢驗(yàn)是用于判斷單個(gè)樣本的觀測(cè)頻率分布是否與其期望的理論頻率分布(如正態(tài)分布、均勻分布等)存在顯著差異。它關(guān)注的是整體分布的吻合程度,而不是變量之間的關(guān)系。3.A解析:卡方獨(dú)立性檢驗(yàn)的自由度決定了卡方分布的形狀,其計(jì)算公式為(行數(shù)-1)×(列數(shù)-1)。自由度的大小直接影響到檢驗(yàn)的臨界值和敏感度。4.A解析:在統(tǒng)計(jì)學(xué)中,P值是衡量證據(jù)強(qiáng)度的一個(gè)指標(biāo)。當(dāng)P值小于預(yù)設(shè)的顯著性水平(如0.05)時(shí),意味著觀察到的數(shù)據(jù)發(fā)生的概率很小,如果原假設(shè)(通常是“無差異”或“無關(guān)聯(lián)”)是真的,那么如此極端的結(jié)果幾乎不可能出現(xiàn)。因此,我們有理由拒絕原假設(shè),認(rèn)為存在真實(shí)差異或關(guān)聯(lián)。5.B解析:卡方檢驗(yàn)中的期望頻數(shù)是基于原假設(shè)(比如獨(dú)立性或特定分布)和樣本數(shù)據(jù)計(jì)算出來的“理論值”。它是如果兩個(gè)變量獨(dú)立,或者數(shù)據(jù)完全符合理論分布時(shí),每個(gè)單元格預(yù)期應(yīng)該有的頻數(shù)。6.A解析:卡方檢驗(yàn)的自由度為0意味著列聯(lián)表只有一個(gè)單元格(即行數(shù)和列數(shù)都減1等于0)。只有一個(gè)單元格時(shí),所有觀測(cè)頻數(shù)加起來等于樣本總數(shù),期望頻數(shù)也等于總數(shù)。此時(shí)卡方統(tǒng)計(jì)量的計(jì)算結(jié)果必然為0,無論觀測(cè)頻數(shù)如何,因?yàn)?觀測(cè)-期望)^2/期望=0。一個(gè)自由度為0的檢驗(yàn)沒有意義,因?yàn)樗荒軈^(qū)分任何情況。7.A解析:與P值小于顯著性水平的情況相反,當(dāng)P值很大(通常大于0.05)時(shí),意味著觀察到的數(shù)據(jù)發(fā)生的概率很大,即使原假設(shè)是真的,這種情況也很可能發(fā)生。因此,我們沒有足夠的證據(jù)拒絕原假設(shè),可以認(rèn)為數(shù)據(jù)與理論分布沒有顯著差異,或者說擬合得不錯(cuò)。8.B解析:根據(jù)卡方檢驗(yàn)的適用條件,當(dāng)期望頻數(shù)過小時(shí)(通常小于5),卡方近似的有效性會(huì)降低,導(dǎo)致結(jié)果不可靠。合并單元格可以增加合并后單元格的期望頻數(shù),使其滿足檢驗(yàn)條件,從而得到更穩(wěn)定、更可靠的檢驗(yàn)結(jié)果。但合并時(shí)必須保證邏輯上合理,且不丟失重要信息。9.B解析:自由度在卡方檢驗(yàn)中至關(guān)重要,因?yàn)樗苯佑绊懙娇ǚ椒植嫉呐R界值。不同的自由度對(duì)應(yīng)不同的卡方分布曲線形狀,從而決定了在相同顯著性水平下,需要多大的卡方統(tǒng)計(jì)量才能拒絕原假設(shè)。自由度越高,分布越分散,臨界值越大,檢驗(yàn)越“嚴(yán)格”。10.B解析:如果理論分布設(shè)定錯(cuò)誤,比如用正態(tài)分布去擬合明顯偏態(tài)的分布,那么觀測(cè)頻數(shù)和基于錯(cuò)誤理論分布計(jì)算出的期望頻數(shù)之間會(huì)出現(xiàn)系統(tǒng)性偏差,導(dǎo)致計(jì)算出的卡方統(tǒng)計(jì)量偏大。這會(huì)使得P值變小,更容易錯(cuò)誤地拒絕原假設(shè),即認(rèn)為擬合不好,盡管實(shí)際數(shù)據(jù)可能只是不適合那個(gè)錯(cuò)誤的理論分布。11.B解析:卡方獨(dú)立性檢驗(yàn)的結(jié)果(P值)本身就反映了兩個(gè)分類變量之間關(guān)聯(lián)的強(qiáng)度和顯著性。如果檢驗(yàn)結(jié)果顯示P值很小(小于顯著性水平),通常意味著兩個(gè)變量之間存在顯著的統(tǒng)計(jì)關(guān)聯(lián)。變量間關(guān)聯(lián)越強(qiáng),觀測(cè)頻數(shù)與期望頻數(shù)的差異通常越大,計(jì)算出的卡方統(tǒng)計(jì)量也越大,P值越小。12.B解析:當(dāng)P值等于顯著性水平(如0.05)時(shí),處于拒絕原假設(shè)和保留原假設(shè)的臨界點(diǎn)上。根據(jù)常見的統(tǒng)計(jì)推斷原則(如Bonferroni修正的嚴(yán)格版本或某些領(lǐng)域的慣例),P值等于α?xí)r傾向于保留原假設(shè),除非有非常強(qiáng)的理由或非嚴(yán)格的標(biāo)準(zhǔn)要求拒絕。更常見的是,如果采用更保守的α(如0.01),P=0.05就意味著不拒絕。13.A解析:樣本量的大小直接影響卡方檢驗(yàn)的效力(即檢測(cè)到真實(shí)差異的能力)和結(jié)果的穩(wěn)定性。樣本量越大,觀測(cè)頻數(shù)通常越多,期望頻數(shù)也相應(yīng)增大,這使得卡方統(tǒng)計(jì)量對(duì)真實(shí)存在的差異更敏感。同時(shí),樣本量大時(shí),期望頻數(shù)不太可能過小,有利于卡方近似的有效性,使檢驗(yàn)結(jié)果更可靠。14.B解析:這與P值小于顯著性水平的情況相反。當(dāng)P值大于顯著性水平時(shí),意味著觀察到的數(shù)據(jù)即使在原假設(shè)(比如兩個(gè)變量獨(dú)立)為真的情況下,發(fā)生的概率也是可以接受的。因此,我們沒有足夠的統(tǒng)計(jì)證據(jù)去否定原假設(shè),結(jié)論是接受原假設(shè),或者說數(shù)據(jù)與理論分布沒有顯著差異。15.B解析:當(dāng)某個(gè)單元格的觀測(cè)頻數(shù)與期望頻數(shù)差異很大時(shí),這意味著該單元格的(觀測(cè)-期望)2/期望這一項(xiàng)在卡方統(tǒng)計(jì)量中貢獻(xiàn)很大。為了使整個(gè)卡方統(tǒng)計(jì)量不至于過大而錯(cuò)誤地拒絕原假設(shè),或者為了使檢驗(yàn)更穩(wěn)定,一個(gè)常見的處理方法是將這個(gè)單元格與其鄰近的單元格(通常是行或列方向上)合并,以增大合并后單元格的期望頻數(shù)。16.B解析:顯著性水平(α)是我們自己設(shè)定的一個(gè)閾值,用來決定在多大程度上愿意冒險(xiǎn)錯(cuò)誤地拒絕原假設(shè)(第一類錯(cuò)誤)。選擇不同的α值會(huì)直接影響檢驗(yàn)的“嚴(yán)格”程度。選擇α=0.01比選擇α=0.05更嚴(yán)格,意味著需要更強(qiáng)的證據(jù)(更小的P值)才拒絕原假設(shè)。因此,顯著性水平的選擇直接決定了我們做出“拒絕原假設(shè)”這個(gè)結(jié)論的門檻。17.B解析:如果理論分布是正態(tài)分布,要驗(yàn)證實(shí)際數(shù)據(jù)是否符合,除了卡方擬合優(yōu)度檢驗(yàn)(通常要求樣本量較大),更常用和推薦的方法是繪制Q-Q(Quantile-Quantile)圖。Q-Q圖將數(shù)據(jù)的分位數(shù)與理論分布(這里是正態(tài)分布)的分位數(shù)進(jìn)行比較,如果數(shù)據(jù)點(diǎn)大致落在一條直線上,則說明數(shù)據(jù)與正態(tài)分布擬合得較好??ǚ綌M合優(yōu)度檢驗(yàn)對(duì)正態(tài)分布的檢驗(yàn)相對(duì)不是最直接或最敏感的方法。18.B解析:如果卡方獨(dú)立性檢驗(yàn)結(jié)果顯示P值很大(大于顯著性水平),意味著沒有足夠的證據(jù)表明兩個(gè)分類變量之間存在統(tǒng)計(jì)上的顯著關(guān)聯(lián)。這通常被解釋為兩個(gè)變量之間沒有顯著關(guān)系,或者說它們是相互獨(dú)立的。這與發(fā)現(xiàn)顯著關(guān)聯(lián)(P值?。┬纬闪藢?duì)比。19.B解析:期望頻數(shù)的計(jì)算是卡方檢驗(yàn)的基礎(chǔ),它提供了比較的基準(zhǔn)??ǚ浇y(tǒng)計(jì)量是通過比較觀測(cè)頻數(shù)(實(shí)際發(fā)生的情況)和期望頻數(shù)(基于假設(shè)發(fā)生的情況)之間的差異來構(gòu)建的。如果期望頻數(shù)計(jì)算錯(cuò)誤或不當(dāng),那么卡方統(tǒng)計(jì)量的計(jì)算和隨后的P值判斷都將失去意義,檢驗(yàn)結(jié)果自然不可靠。因此,正確計(jì)算期望頻數(shù)至關(guān)重要,它直接影響P值的計(jì)算。20.A解析:這與P值小于顯著性水平的情況相反。當(dāng)P值大于顯著性水平時(shí),意味著觀察到的數(shù)據(jù)即使在原假設(shè)(比如數(shù)據(jù)符合某個(gè)理論分布)為真的情況下,發(fā)生的概率也是可以接受的。因此,我們沒有足夠的統(tǒng)計(jì)證據(jù)去否定原假設(shè),結(jié)論是接受原假設(shè),或者說數(shù)據(jù)與理論分布沒有顯著差異,或者說符合理論分布。二、填空題答案及解析1.(行數(shù)-1)×(列數(shù)-1)解析:這是卡方獨(dú)立性檢驗(yàn)中自由度的標(biāo)準(zhǔn)計(jì)算公式。它反映了列聯(lián)表中可以自由變化的單元格數(shù)量的最大值,決定了卡方分布的形狀,進(jìn)而影響檢驗(yàn)的臨界值和結(jié)論。2.拒絕原假設(shè)解析:這是統(tǒng)計(jì)推斷中的標(biāo)準(zhǔn)決策規(guī)則。當(dāng)P值小于預(yù)設(shè)的顯著性水平α?xí)r,表明觀測(cè)到的數(shù)據(jù)與原假設(shè)所描述的情況出現(xiàn)得過于偶然,不足以用隨機(jī)性來解釋。因此,有足夠的統(tǒng)計(jì)證據(jù)支持反面觀點(diǎn),即拒絕原假設(shè)。3.理論分布解析:在進(jìn)行卡方擬合優(yōu)度檢驗(yàn)時(shí),我們需要一個(gè)預(yù)期的理論分布作為比較的標(biāo)準(zhǔn)。這個(gè)理論分布可以是已知的理論模型(如正態(tài)分布、二項(xiàng)分布),也可以是基于經(jīng)驗(yàn)或假設(shè)的分布。檢驗(yàn)的目的就是看實(shí)際觀測(cè)到的頻率分布是否顯著偏離這個(gè)理論分布。4.合并單元格解析:當(dāng)列聯(lián)表中某個(gè)單元格的期望頻數(shù)過小時(shí)(通常小于5),直接使用卡方檢驗(yàn)可能會(huì)導(dǎo)致結(jié)果不穩(wěn)定或不可靠。為了解決這個(gè)問題,一個(gè)常用的方法是將這個(gè)期望頻數(shù)小的單元格與其相鄰的單元格(通常是行或列方向上)合并,形成一個(gè)新的單元格。合并可以增大新單元格的期望頻數(shù),使其滿足檢驗(yàn)的常規(guī)要求。5.它決定了檢驗(yàn)的顯著性水平解析:自由度本身并不直接決定我們?cè)O(shè)定的顯著性水平(α),但它與α共同決定了卡方統(tǒng)計(jì)量需要多大才能拒絕原假設(shè)。對(duì)于給定的α和自由度,存在一個(gè)臨界值。自由度越高,對(duì)應(yīng)的卡方分布越分散,臨界值越大,意味著需要更大的卡方統(tǒng)計(jì)量才能在α水平下拒絕原假設(shè)??梢哉f,自由度是卡方檢驗(yàn)嚴(yán)格性的一個(gè)內(nèi)在組成部分。6.P值會(huì)增大解析:如果理論分布設(shè)定錯(cuò)誤,導(dǎo)致觀測(cè)頻數(shù)與基于錯(cuò)誤理論分布計(jì)算出的期望頻數(shù)之間差異很大(即使隨機(jī)波動(dòng)也可能導(dǎo)致),計(jì)算出的卡方統(tǒng)計(jì)量會(huì)偏大。根據(jù)卡方分布的性質(zhì),更大的統(tǒng)計(jì)量對(duì)應(yīng)著更小的P值。但如果理論分布錯(cuò)誤得讓P值增大(這不太常見,通常錯(cuò)誤導(dǎo)致P值減?。敲匆馕吨ǚ浇y(tǒng)計(jì)量變小,即觀測(cè)與期望的差異不顯著,從而更容易接受原假設(shè)(擬合良好)。7.兩個(gè)分類變量之間存在顯著的統(tǒng)計(jì)關(guān)聯(lián)解析:卡方獨(dú)立性檢驗(yàn)的目的是判斷兩個(gè)分類變量之間是否存在關(guān)聯(lián)或關(guān)系。如果檢驗(yàn)結(jié)果顯示P值顯著(小于α),則表明有足夠的統(tǒng)計(jì)證據(jù)表明這兩個(gè)變量不是獨(dú)立的,它們之間存在某種程度的關(guān)聯(lián)。關(guān)聯(lián)的強(qiáng)度通常需要結(jié)合卡方統(tǒng)計(jì)量的大小或Cramer'sV等指標(biāo)來解讀,但顯著性本身證明了關(guān)聯(lián)的存在。8.接受原假設(shè)解析:與P值小于顯著性水平的情況相反。當(dāng)P值等于α?xí)r,根據(jù)一些統(tǒng)計(jì)推斷規(guī)則(如精確的α=0.05臨界點(diǎn)判斷或某些領(lǐng)域的慣例),傾向于不拒絕原假設(shè)。這意味著觀察到的數(shù)據(jù)在原假設(shè)為真的情況下發(fā)生的概率正好處于我們可以接受的邊緣。結(jié)論是保留原假設(shè),或者說沒有足夠證據(jù)表明差異或關(guān)聯(lián)存在。9.它影響了檢驗(yàn)的準(zhǔn)確性解析:樣本量的大小是影響統(tǒng)計(jì)檢驗(yàn)準(zhǔn)確性的關(guān)鍵因素之一。樣本量越大,檢驗(yàn)通常越準(zhǔn)確,能夠更可靠地檢測(cè)出真實(shí)存在的差異或關(guān)聯(lián)(更高的統(tǒng)計(jì)效力)。同時(shí),較大的樣本量也使得期望頻數(shù)增大,減少卡方近似失效的風(fēng)險(xiǎn)。樣本量小則可能導(dǎo)致檢驗(yàn)準(zhǔn)確性下降,更容易受到隨機(jī)波動(dòng)影響。10.它決定了檢驗(yàn)的顯著性水平解析:這個(gè)填空與第5題相同。顯著性水平(α)是我們預(yù)先設(shè)定的判斷標(biāo)準(zhǔn),用來控制第一類錯(cuò)誤的概率。選擇α值(如0.05,0.01)直接決定了我們做出“拒絕原假設(shè)”這一結(jié)論的門檻高低。α值越小,檢驗(yàn)越嚴(yán)格,越不容易拒絕原假設(shè);α值越大,檢驗(yàn)越寬松。因此,顯著性水平的選擇直接定義了檢驗(yàn)的嚴(yán)格程度。三、簡(jiǎn)答題答案及解析1.卡方擬合優(yōu)度檢驗(yàn)的基本原理是比較樣本觀測(cè)到的某個(gè)分類變量的頻率分布與預(yù)期的理論頻率分布之間的差異。它假設(shè)樣本是從一個(gè)具有特定理論分布的總體中隨機(jī)抽取的。檢驗(yàn)通過計(jì)算每個(gè)類別的觀測(cè)頻數(shù)(O)和基于理論分布計(jì)算出的期望頻數(shù)(E)之間的差異的加權(quán)平方和(Σ(O-E)2/E),得到一個(gè)卡方統(tǒng)計(jì)量χ2。如果χ2值很大,超過了在給定自由度(類別數(shù)-1)和顯著性水平下卡方分布的臨界值,就拒絕原假設(shè),認(rèn)為觀測(cè)分布與理論分布存在顯著差異;否則,認(rèn)為沒有足夠證據(jù)拒絕原假設(shè),可以認(rèn)為觀測(cè)分布擬合理論分布。應(yīng)用場(chǎng)景非常廣泛,比如檢驗(yàn)一枚骰子是否均勻、調(diào)查的樣本結(jié)果是否符合預(yù)期的投票比例、產(chǎn)品的合格率是否符合標(biāo)準(zhǔn)等等,只要涉及到將數(shù)據(jù)分類并比較觀測(cè)頻率與理論頻率。2.期望頻數(shù)是在卡方獨(dú)立性檢驗(yàn)中,基于原假設(shè)(比如兩個(gè)分類變量相互獨(dú)立)和樣本的總?cè)藬?shù)以及各分類的邊際總和計(jì)算出來的理論頻數(shù)。它代表了如果兩個(gè)變量真的獨(dú)立,那么在樣本總數(shù)不變的情況下,每個(gè)單元格預(yù)期應(yīng)該有多少個(gè)觀察單位。計(jì)算方法是:期望頻數(shù)=(該行總?cè)藬?shù)×該列總?cè)藬?shù))/樣本總?cè)藬?shù)。例如,在2x2表中,單元格(1,1)的期望頻數(shù)=(行1總?cè)藬?shù)×列1總?cè)藬?shù))/總?cè)藬?shù)。在卡方檢驗(yàn)中,我們將每個(gè)單元格的(觀測(cè)頻數(shù)-期望頻數(shù))2除以期望頻數(shù),然后求和,得到卡方統(tǒng)計(jì)量χ2。期望頻數(shù)是判斷觀測(cè)到的差異是否過大的基準(zhǔn)。而有時(shí)候,某個(gè)單元格的期望頻數(shù)太小(通常小于5,有時(shí)是1),會(huì)使得卡方統(tǒng)計(jì)量的計(jì)算結(jié)果不穩(wěn)定,其近似服從卡方分布的性質(zhì)可能失效,導(dǎo)致檢驗(yàn)結(jié)果不可靠。解決這個(gè)問題的常用策略是合并相鄰的單元格,以增大合并后單元格的期望頻數(shù),使其滿足檢驗(yàn)的常規(guī)要求。3.判斷卡方檢驗(yàn)樣本量是否足夠大,沒有一個(gè)絕對(duì)統(tǒng)一的硬性規(guī)定,但通常有兩個(gè)方面的考慮:一是期望頻數(shù)的分布,二是統(tǒng)計(jì)推斷的效力。首先,根據(jù)經(jīng)驗(yàn)法則,尤其是在2x2列聯(lián)表中,最好確保所有單元格的期望頻數(shù)都不小于5。如果有些單元格的期望頻數(shù)小于5,特別是小于1,卡方檢驗(yàn)的有效性會(huì)降低。這時(shí)可以考慮合并單元格,或者使用Fisher精確檢驗(yàn)(適用于2x2表期望頻數(shù)過小的情況)。對(duì)于更大的表格,雖然不要求每個(gè)單元格都>=5,但通常希望至少有80%-90%以上的單元格期望頻數(shù)>=5,且沒有很多單元格期望頻數(shù)非常小。其次,樣本量的大小也影響檢驗(yàn)的效力,即檢測(cè)到真實(shí)差異的能力。樣本量越大,檢驗(yàn)的效力通常越高,越能檢測(cè)出微小的差異。但樣本量過大也可能導(dǎo)致即使是很小的、無實(shí)際意義的差異也被檢測(cè)出來。因此,判斷樣本量是否足夠,不僅要看期望頻數(shù),還要結(jié)合研究目的和實(shí)際數(shù)據(jù)情況綜合判斷。4.卡方擬合優(yōu)度檢驗(yàn)和卡方獨(dú)立性檢驗(yàn)都是基于卡方分布進(jìn)行的統(tǒng)計(jì)推斷方法,都處理分類數(shù)據(jù),但它們的目的、假設(shè)和應(yīng)用場(chǎng)景有顯著區(qū)別??ǚ綌M合優(yōu)度檢驗(yàn)主要用于判斷單個(gè)分類變量樣本的觀測(cè)頻率分布是否與其預(yù)期的理論頻率分布(如正態(tài)分布、均勻分布等)存在顯著差異。它的核心是“分布對(duì)不對(duì)?”,檢驗(yàn)的是整體分布的吻合度。例如,檢驗(yàn)一批產(chǎn)品的顏色分布是否符合3:2:1的理論比例。而卡方獨(dú)立性檢驗(yàn)則用于判斷兩個(gè)分類變量之間是否存在關(guān)聯(lián)或關(guān)系。它的核心是“有關(guān)系嗎?”,檢驗(yàn)的是變量間的獨(dú)立性假設(shè)。例如,檢驗(yàn)性別與喜好(如喜歡蘋果還是香蕉)是否有關(guān)聯(lián)。在計(jì)算上,擬合優(yōu)度檢驗(yàn)計(jì)算每個(gè)類別的期望頻數(shù),獨(dú)立性檢驗(yàn)計(jì)算列聯(lián)表中每個(gè)單元格的期望頻數(shù)。它們的自由度計(jì)算也不同:擬合優(yōu)度是類別數(shù)減1,獨(dú)立性是(行數(shù)-1)乘以(列數(shù)-1)。簡(jiǎn)單來說,擬合優(yōu)度看“一個(gè)”分布怎么樣,獨(dú)立性看“兩個(gè)”變量有沒有關(guān)系。5.在實(shí)際研究中進(jìn)行卡方檢驗(yàn)時(shí)可能遇到的問題主要有:期望頻數(shù)過小,如2x2表中單元格期望頻數(shù)小于5,或更大表中有很多單元格小于5,這會(huì)導(dǎo)致卡方近似失效,結(jié)果不可靠;樣本量過大,雖然期望頻數(shù)可能滿足要求,但可能導(dǎo)致檢測(cè)到微小的、無實(shí)際意義的差異,即第一類錯(cuò)誤概率虛高,需要關(guān)注效應(yīng)量;數(shù)據(jù)不滿足隨機(jī)抽樣或獨(dú)立性的假設(shè),比如存在重復(fù)測(cè)量、聚類抽樣或關(guān)聯(lián)樣本,直接用獨(dú)立性檢驗(yàn)可能不合適;理論分布設(shè)定錯(cuò)誤,比如用不適合的理論分布去擬合數(shù)據(jù),導(dǎo)致期望頻數(shù)與觀測(cè)頻數(shù)差異被錯(cuò)誤放大或縮??;列聯(lián)表設(shè)計(jì)不合理,比如分類過粗或過細(xì),影響了檢驗(yàn)的敏感性和解釋性。針對(duì)這些問題,可以采取的應(yīng)對(duì)策略包括:增加樣本量以增大期望頻數(shù);合并單元格(需謹(jǐn)慎,確保邏輯合理);使用Fisher精確檢驗(yàn)(尤其適用于2x2表);對(duì)于關(guān)聯(lián)樣本,使用針對(duì)有序分類變量的非參數(shù)檢驗(yàn)(如Mantel-Haenszel檢驗(yàn));檢查并修正理論分布設(shè)定;優(yōu)化列聯(lián)表設(shè)計(jì);在解釋結(jié)果時(shí),結(jié)合效應(yīng)量和研究背景進(jìn)行審慎說明。四、計(jì)算題答案及解析1.解析:此題是卡方獨(dú)立性檢驗(yàn)。首先,計(jì)算每個(gè)單元格的期望頻數(shù)。例如,滿意且選擇課程A的期望頻數(shù)E??=(70×60)/130≈32.31;滿意且選擇課程B的E??=(70×70)/130≈37.69;一般且選擇課程A的E??=(35×60)/130≈16.15;一般且選擇課程B的E??=(35×70)/130≈18.85;不滿意且選擇課程A的E??=(25×60)/130≈11.54;不滿意且選擇課程B的E??=(25×70)/130≈13.46。然后,計(jì)算卡方統(tǒng)計(jì)量χ2:χ2=Σ(觀測(cè)頻數(shù)-期望頻數(shù))2/期望頻數(shù)χ2=(30-32.31)2/32.31+(40-37.69)2/37.69+(20-16.15)2/16.15+(15-18.85)2/18.85+(10-11.54)2/11.54+(15-13.46)2/13.46χ2≈(-2.31)2/32.31+(2.31)2/37.69+(3.85)2/16.15+(-3.85)2/18.85+(-1.54)2/11.54+(1.54)2/13.46χ2≈5.34/32.31+5.34/37.69+14.82/16.15+14.82/18.85+2.37/11.54+2.37/13.46χ2≈0.165+0.141+0.915+0.785+0.205+0.176χ2≈2.437自由度df=(行數(shù)-1)×(列數(shù)-1)=(3-1)×(2-1)=2查卡方分布表,α=0.05,df=2,臨界值約為5.991。因?yàn)橛?jì)算出的χ2(2.437)<臨界值(5.991),所以P值>0.05。結(jié)論:在α=0.05的顯著性水平下,沒有足夠的證據(jù)拒絕原假設(shè),即認(rèn)為滿意度與課程選擇之間沒有顯著差異。2.解析:此題是卡方擬合優(yōu)度檢驗(yàn)。理論比例是3:2:1,總樣本量是200。首先,計(jì)算每種顏色的期望頻數(shù)。紅色E?=200×(3/(3+2+1))=200×(3/6)=100;黃色E?=200×(2/6)=200×(1/3)≈66.67;藍(lán)色E?=200×(1/6)≈33.33。然后,計(jì)算卡方統(tǒng)計(jì)量χ2:χ2=Σ(觀測(cè)頻數(shù)-期望頻數(shù))2/期望頻數(shù)χ2=(75-100)2/100+(50-66.67)2/66.67+(75-33.33)2/33.33χ2=(-25)2/100+(-16.67)2/66.67+(41.67)2/33.33χ2=625/100+278.89/66.67+1736.11/33.33χ2=6.25+4.17+52.00χ2≈62.42自由度df=(類別數(shù)-1)=3-1=2查卡方分布表,α=0.01,df=2,臨界值約為9.210。因?yàn)橛?jì)算出的χ2(62.42)>臨界值(9.210),所以P值<0.01。結(jié)論:在α=0.01的顯著性水平下,有足夠的證據(jù)拒絕原假設(shè),即認(rèn)為實(shí)際產(chǎn)品顏色分布與理論比例3:2:1存在顯著差異。3.解析:此題是卡方獨(dú)立性檢驗(yàn)。首先,計(jì)算每個(gè)單元格的期望頻數(shù)。例如,治愈且患有疾病1的期望頻數(shù)E??=(75×100)/200=37.5;治愈且患有疾病2的E??=(75×100)/200=37.5;未治愈且患有疾病1的E??=(125×100)/200=62.5;未治愈且患有疾病2的E??=(125×100)/200=62.5。然后,計(jì)算卡方統(tǒng)計(jì)量χ2:χ2=Σ(觀測(cè)頻數(shù)-期望頻數(shù))2/期望頻數(shù)χ2=(30-37.5)2/37.5+(45-37.5)2/37.5+(70-62.5)2/62.5+(55-62.5)2/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論