版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2025年大學(xué)《應(yīng)用統(tǒng)計學(xué)》專業(yè)題庫——非參數(shù)統(tǒng)計方法及其在實(shí)際問題中的應(yīng)用考試時間:______分鐘總分:______分姓名:______一、選擇題(每題2分,共20分)1.下列哪種情況最適合采用非參數(shù)統(tǒng)計方法進(jìn)行分析?A.樣本量非常大,接近正態(tài)分布B.檢驗(yàn)兩個連續(xù)變量的相關(guān)性,但數(shù)據(jù)明顯非正態(tài)C.比較兩個獨(dú)立總體的均值,但數(shù)據(jù)服從嚴(yán)重偏態(tài)分布D.配對比較同一組對象處理前后的結(jié)果,數(shù)據(jù)近似正態(tài)2.在符號檢驗(yàn)中,用于檢驗(yàn)樣本中正負(fù)符號數(shù)量差異是否顯著的統(tǒng)計量是?A.Wilcoxon秩和統(tǒng)計量WB.Mann-WhitneyU統(tǒng)計量C.符號檢驗(yàn)統(tǒng)計量Z(基于正態(tài)近似)D.Kruskal-WallisH統(tǒng)計量3.對于兩個獨(dú)立樣本的秩和檢驗(yàn)(Mann-WhitneyU檢驗(yàn)),其零假設(shè)(H0)是?A.兩個總體的均值相等B.兩個總體的中位數(shù)相等C.兩個總體的分布函數(shù)相等D.兩個總體的方差相等4.在Wilcoxon符號秩檢驗(yàn)中,如果樣本量為n,則檢驗(yàn)統(tǒng)計量W的可能取值范圍是?A.0到nB.1到nC.0到n(n+1)/2D.-n到n5.游程檢驗(yàn)主要用于檢驗(yàn)?A.兩個獨(dú)立樣本分布的差異B.配對樣本分布的差異C.一個樣本數(shù)據(jù)序列的隨機(jī)性D.兩個連續(xù)變量之間的相關(guān)性6.當(dāng)樣本量較大時(n>30),進(jìn)行符號檢驗(yàn)時,檢驗(yàn)統(tǒng)計量Z通常依據(jù)什么分布進(jìn)行近似?A.t分布B.F分布C.卡方分布D.標(biāo)準(zhǔn)正態(tài)分布7.對于檢驗(yàn)兩個總體分布是否相等,Kolmogorov-Smirnov檢驗(yàn)使用的統(tǒng)計量是?A.秩均值之差B.最大絕對差值C.符號數(shù)量之差D.秩和統(tǒng)計量8.在列聯(lián)表分析中,當(dāng)行變量和列變量都是二分類名義變量時,最常用的非參數(shù)檢驗(yàn)方法是?A.秩和檢驗(yàn)B.符號檢驗(yàn)C.卡方獨(dú)立性檢驗(yàn)D.Fisher精確檢驗(yàn)9.Fisher精確檢驗(yàn)主要適用于哪種情況?A.大樣本的獨(dú)立性檢驗(yàn)B.小樣本的關(guān)聯(lián)性檢驗(yàn)C.比較兩個總體的均值D.檢驗(yàn)樣本的隨機(jī)性10.檢驗(yàn)兩個連續(xù)變量之間是否存在單調(diào)關(guān)系,最常用的非參數(shù)方法是?A.Pearson相關(guān)系數(shù)B.Spearman秩相關(guān)系數(shù)C.Kendal'stauD.Mann-WhitneyU檢驗(yàn)二、填空題(每空1分,共8分)1.非參數(shù)檢驗(yàn)方法通常不依賴于總體的特定__________分布假設(shè)。2.在符號檢驗(yàn)中,如果觀察到的正號數(shù)量遠(yuǎn)多于負(fù)號,且期望的正負(fù)號數(shù)量相等,則通常計算檢驗(yàn)統(tǒng)計量__________的值來判斷是否拒絕零假設(shè)。3.Mann-WhitneyU檢驗(yàn)中,統(tǒng)計量U是基于兩個樣本秩次的__________和__________計算得到的。4.進(jìn)行Wilcoxon符號秩檢驗(yàn)時,首先對差值的絕對值進(jìn)行排序,得到相應(yīng)的__________,然后根據(jù)原始差值的正負(fù)賦予秩次。5.游程檢驗(yàn)中,樣本數(shù)據(jù)序列中相同符號的連續(xù)片段稱為一個__________,不同符號片段之間的過渡稱為一個__________。6.卡方檢驗(yàn)不僅可以用于檢驗(yàn)獨(dú)立性,也可以用于檢驗(yàn)__________的擬合優(yōu)度。7.當(dāng)使用Spearman秩相關(guān)系數(shù)檢驗(yàn)變量X和Y的相關(guān)性時,如果X和Y之間存在完美的正相關(guān)關(guān)系,則相關(guān)系數(shù)ρ的值為__________。8.對于檢驗(yàn)三個或更多獨(dú)立總體的分布差異,常用的非參數(shù)方法是__________檢驗(yàn)。三、名詞解釋(每題3分,共12分)1.非參數(shù)檢驗(yàn)2.秩和檢驗(yàn)(Mann-WhitneyU檢驗(yàn))3.游程檢驗(yàn)4.Spearman秩相關(guān)系數(shù)四、判斷題(每題2分,共16分)1.非參數(shù)檢驗(yàn)的檢驗(yàn)效力(即當(dāng)零假設(shè)不成立時拒絕零假設(shè)的能力)通常低于參數(shù)檢驗(yàn)。()2.符號檢驗(yàn)既適用于小樣本,也適用于大樣本,且不需要知道總體分布的具體形式。()3.在Wilcoxon符號秩檢驗(yàn)中,若差值為0,則通常將其賦予中間的秩次,并排除在檢驗(yàn)統(tǒng)計量計算之外。()4.卡方檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法,它適用于分類數(shù)據(jù)。()5.游程檢驗(yàn)的拒絕域取決于樣本量n以及游程數(shù)R,且當(dāng)n固定時,R的取值范圍是有限的。()6.當(dāng)使用Kolmogorov-Smirnov檢驗(yàn)比較樣本分布與理論分布時,統(tǒng)計量D計算的是樣本經(jīng)驗(yàn)分布函數(shù)與理論分布函數(shù)的最大差異絕對值。()7.Fisher精確檢驗(yàn)是一種基于超幾何分布的精確概率計算方法,它不依賴于樣本量的大小。()8.Spearman秩相關(guān)系數(shù)是度量兩個變量之間線性相關(guān)程度的,其取值范圍在-1到+1之間,與Pearson相關(guān)系數(shù)的計算原理相同。()五、計算題(每題10分,共30分)1.某研究者想比較兩種不同教學(xué)方法(方法A和方法B)對學(xué)生的考試成績是否有顯著影響。隨機(jī)抽取10名學(xué)生,采用方法A學(xué)習(xí),采用方法B學(xué)習(xí)的也為10名學(xué)生,一段時間后獲得他們的考試成績?nèi)缦拢▎挝唬悍郑悍椒ˋ:85,78,92,88,76,90,85,80,82,87方法B:80,83,75,85,78,82,79,84,88,81假設(shè)兩個樣本的考試成績數(shù)據(jù)均不服從正態(tài)分布,請使用適當(dāng)?shù)姆菂?shù)方法檢驗(yàn)兩種教學(xué)方法下的平均成績是否存在顯著差異。請寫出檢驗(yàn)的完整過程,包括假設(shè)、計算檢驗(yàn)統(tǒng)計量、查找臨界值或計算P值、得出結(jié)論。2.某醫(yī)生想比較一種新藥(處理組)和安慰劑(對照組)對降低患者血壓的效果。選取12名高血壓患者,記錄他們在服用藥物前后的收縮壓變化值(收縮壓差值=用藥后收縮壓-用藥前收縮壓)如下:處理組(新藥):-15,-10,-20,-5,-12,-18對照組(安慰劑):-3,0,-2,5,-1,2請使用Wilcoxon符號秩檢驗(yàn)分析新藥在降低收縮壓方面是否比安慰劑更有效。請寫出檢驗(yàn)的完整過程。3.某公司想知道每周工作時長(X,單位:小時)與員工滿意度評分(Y,1-10分)之間是否存在關(guān)系。隨機(jī)抽取了15名員工,得到如下數(shù)據(jù):(45,6),(40,5),(50,7),(35,4),(55,8),(38,3),(48,6),(42,5),(60,9),(33,4),(47,7),(51,6),(39,5),(44,7),(53,8)請使用Spearman秩相關(guān)系數(shù)分析每周工作時長與員工滿意度評分之間是否存在單調(diào)關(guān)系,并說明分析結(jié)果。六、簡答題(每題5分,共10分)1.簡述符號檢驗(yàn)和秩和檢驗(yàn)(Mann-WhitneyU檢驗(yàn))各自的適用條件和主要區(qū)別。2.在什么情況下適合使用卡方檢驗(yàn)來分析列聯(lián)表數(shù)據(jù)?卡方檢驗(yàn)的主要目的是什么?七、論述題(15分)試述非參數(shù)統(tǒng)計方法在現(xiàn)代社會和科學(xué)研究中的重要性,并舉例說明其在哪些類型的實(shí)際問題中具有獨(dú)特的應(yīng)用價值。試卷答案一、選擇題1.C2.C3.C4.C5.C6.D7.B8.C9.B10.B二、填空題1.特定2.Z3.秩次,秩和4.秩次5.游程,過渡6.擬合優(yōu)度7.+18.Kruskal-WallisH三、名詞解釋1.非參數(shù)檢驗(yàn):一類統(tǒng)計推斷方法,它們對總體的分布形態(tài)不做特定假設(shè),主要利用數(shù)據(jù)的秩次或頻數(shù)信息進(jìn)行分析。2.秩和檢驗(yàn)(Mann-WhitneyU檢驗(yàn)):一種用于檢驗(yàn)兩個獨(dú)立樣本是否來自具有相同分布函數(shù)的總體的非參數(shù)方法,通過比較兩個樣本的秩次和來做出判斷。3.游程檢驗(yàn):一種用于檢驗(yàn)一個樣本數(shù)據(jù)序列的隨機(jī)性或檢驗(yàn)兩個變量是否獨(dú)立性的非參數(shù)方法,通過計算序列中相同符號的連續(xù)片段(游程)的數(shù)量和長度來進(jìn)行判斷。4.Spearman秩相關(guān)系數(shù):一種用于度量兩個變量之間單調(diào)關(guān)系強(qiáng)度的非參數(shù)統(tǒng)計量,基于兩個變量的秩次計算得到,取值范圍在-1到+1之間。四、判斷題1.√2.√3.√4.√5.√6.√7.√8.×(Spearman秩相關(guān)系數(shù)度量單調(diào)關(guān)系,Pearson相關(guān)系數(shù)度量線性關(guān)系)五、計算題1.解:(1)假設(shè):H0:方法A和方法B的考試成績分布相同;H1:方法A和方法B的考試成績分布不同。(2)數(shù)據(jù)準(zhǔn)備與秩次排列:合并數(shù)據(jù)并排序:72,75,76,77,78,79,80,81,82,83,84,85,85,86,87,88,88,90,92,95秩次:1,2,3,4,5,6,7,8,9,10,11,12.5,12.5,14,15,16,17,17,18,19方法A數(shù)據(jù)及其秩次:85(12.5),78(4),92(19),88(16),76(2),90(18),85(12.5),80(8),82(9),87(15)->RankA=12.5+4+19+16+2+18+12.5+8+9+15=105方法B數(shù)據(jù)及其秩次:80(8),83(10),75(1),85(12.5),78(4),82(9),79(6),84(11),88(16),81(7)->RankB=8+10+1+12.5+4+9+6+11+16+7=84.5(3)計算檢驗(yàn)統(tǒng)計量:選擇計算U1:U1=nA*nB+nA*(nA+1)/2-RankA=10*10+10*11/2-105=100+55-105=50選擇計算U2:U2=nA*nB+nB*(nB+1)/2-RankB=10*10+10*11/2-84.5=100+55-84.5=70.5取U=min(U1,U2)=min(50,70.5)=50(4)查找臨界值或計算P值:查Mann-WhitneyU分布表(α=0.05,雙尾),nA=10,nB=10,臨界值Ucrit=35。由于50>35,不能拒絕H0。(或使用正態(tài)近似:Z=(U-nA*nB/2)/sqrt(nA*nB*(nA+nB+1)/12)=(50-50)/sqrt(10*10*(10+10+1)/12)=0/sqrt(500/12)=0。Z=0對應(yīng)的P值遠(yuǎn)大于0.05。)(5)結(jié)論:在α=0.05水平上,沒有足夠證據(jù)拒絕H0,認(rèn)為兩種教學(xué)方法下的平均成績沒有顯著差異。2.解:(1)假設(shè):H0:新藥和安慰劑對降低收縮壓的效果無差異(即差值分布相同);H1:新藥降低收縮壓的效果優(yōu)于安慰劑(即新藥差值分布大于安慰劑差值)。(2)計算差值并忽略差值為0的觀測:新藥:-15,-10,-20,-5,-12,-18(6個);安慰劑:-3,0,-2,5,-1,2(6個,忽略0)(3)檢驗(yàn)是否配對:由于是同一批患者用藥前后的比較,屬于配對設(shè)計,應(yīng)使用Wilcoxon符號秩檢驗(yàn)。(4)計算檢驗(yàn)統(tǒng)計量W(基于非零差值):差值的絕對值并排序:3,5,10,12,15,20->秩次:1,2,3,4,5,6原始差值的秩次(正為+,負(fù)為-):-6,-3,-4,+2,-5,-6->秩次和:-6-3-4+2-5-6=-22W=min(W+,W-)=min(0,-22)=0(5)查找臨界值或計算P值:查Wilcoxon符號秩檢驗(yàn)表(α=0.05,單尾),n=6,臨界值Wcrit=0。由于W=0<=0,拒絕H0。(或使用正態(tài)近似:W+=0,W-=-22,W=min(0,-22)=0。Z=(W-n(n+1)/4)/sqrt(n(n+1)(2n+1)/24)=(0-6*7/4)/sqrt(6*7*13/24)=-10.5/sqrt(91/4)=-10.5/4.76=-2.20。Z=-2.20對應(yīng)的單尾P值約為0.013<0.05。)(6)結(jié)論:在α=0.05水平上,有足夠證據(jù)拒絕H0,認(rèn)為新藥在降低收縮壓方面比安慰劑更有效。3.解:(1)計算Spearman秩相關(guān)系數(shù)ρ:15名員工數(shù)據(jù):X=[45,40,50,35,55,38,48,42,60,33,47,51,39,44,53]Y=[6,5,7,4,8,3,6,5,9,4,7,6,5,7,8]排序X,得到X的秩次R(x):R(x)=[7,4,8,2,9,3,6,5,10,1,7,8,5,6,9]排序Y,得到Y(jié)的秩次R(y):R(y)=[3,2,8,1,9,0,6,2,10,1,8,8,2,6,9](注意Y中存在相同的值5,6,7,8,按出現(xiàn)順序賦予平均秩次:Y的實(shí)際秩次=[3,2,8,1,9,0,6,2,10,1,8,8,2,6,9])計算d_i=R(x_i)-R(y_i)及d_i^2:|X秩-RY秩||X秩-RY秩|^24162400111139003900001100390039Σ(d_i^2)=16+4+0+1+1+9+0+9+0+0+1+0+9+0+9=54(2)計算相關(guān)系數(shù):ρ=1-(6*Σd_i^2)/(n(n^2-1))=1-(6*54)/(15*(15^2-1))=1-324/(15*224)=1-324/3360=1-0.0964=0.9036(3)結(jié)論:Spearman秩相關(guān)系數(shù)ρ約為0.904,表明每周工作時長與員工滿意度評分之間存在較強(qiáng)的正單調(diào)關(guān)系。六、簡答題1.答:適用條件與主要區(qū)別:*適用條件:*符號檢驗(yàn):配對樣本(如前后測)或獨(dú)立樣本比較的差值數(shù)據(jù),不要求差值分布正態(tài),只需知道正負(fù)符號;適用于等級資料。*秩和檢驗(yàn)(Mann-WhitneyU):兩個獨(dú)立樣本的比較,不要求樣本服從正態(tài)分布,不要求兩組方差相等,數(shù)據(jù)至少為順序變量(秩次)。*主要區(qū)別:*數(shù)據(jù)要求:符號檢驗(yàn)只關(guān)注差值的正負(fù)符號,數(shù)據(jù)可任意;秩和檢驗(yàn)關(guān)注數(shù)據(jù)的秩次。*信息利用:符號檢驗(yàn)只利用了差值的符號信息,信息損失較大;秩和檢驗(yàn)利用了數(shù)據(jù)的秩次信息,比符號檢驗(yàn)更有效。*效力:在相同條件下,秩和檢驗(yàn)(Mann-WhitneyU)的檢驗(yàn)效力通常高于符號檢驗(yàn)。2.答:使用條件與目的:*使用條件:當(dāng)研究的變量是定類變量(名義變量)或定序變量(等級變量),且希望檢驗(yàn)這些變量之間是否存在關(guān)聯(lián)性或不同類別間是否存在差異時,適合使用卡方檢驗(yàn)分析列聯(lián)表數(shù)據(jù)。*主要目的:卡方檢驗(yàn)的主要目的是檢驗(yàn)列聯(lián)表(交叉表)中兩個分類變量之間是否獨(dú)立。通過比較觀測頻數(shù)和期望頻數(shù)(在零假設(shè)下),判斷兩個分類變量之間是否存在顯著的關(guān)聯(lián)關(guān)系。七、論述題試述非參數(shù)統(tǒng)計方法在現(xiàn)代社會和科學(xué)研究中的重要性,并舉例說明其在哪些類型的實(shí)際問題中具有獨(dú)特的應(yīng)用價值。非參數(shù)統(tǒng)計方法在現(xiàn)代社會科學(xué)和科學(xué)研究中的重要性日益凸顯。其核心優(yōu)勢在于對總體分布形態(tài)不做嚴(yán)格假設(shè),具有廣泛的適用性。這使得非參數(shù)方法能夠處理各種類型的數(shù)據(jù),特別是當(dāng)數(shù)據(jù)不滿足參數(shù)檢驗(yàn)(如t檢驗(yàn)、方差分析)的正態(tài)性、方差齊性等關(guān)鍵假設(shè)時,非參數(shù)方法成為了可靠的分析選擇。其重要性體現(xiàn)在以下幾個方面:1.適用性廣:能夠處理各種類型的數(shù)據(jù),包括名義變量、定序變量、等級數(shù)據(jù)以及不滿足正態(tài)分布的連續(xù)變量數(shù)據(jù)。在數(shù)據(jù)收集過程中,往往難以滿足參數(shù)檢驗(yàn)的嚴(yán)格假設(shè),非參數(shù)方法提供了靈活的解決方案。2.減少信息損失:對于嚴(yán)重偏態(tài)、極端值較多或存在異常點(diǎn)的數(shù)據(jù)集,參數(shù)檢驗(yàn)可能因異常值的影響而結(jié)果失真。非參數(shù)檢驗(yàn)通過使用秩次或頻數(shù)信息,可以減少異常值對分析結(jié)果的影響,提供更穩(wěn)健的推斷。3.處理小樣本問題:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年杭州豐潭中學(xué)提前批筆試及答案
- 2025年拓殖大學(xué)經(jīng)營學(xué)筆試題目及答案
- 2025年西農(nóng)農(nóng)管復(fù)試筆試及答案
- 2025年國考新疆歷年筆試及答案
- 2025年??途W(wǎng)后端筆試題庫及答案
- 2025年人社部直屬事業(yè)單位考試及答案
- 2025年西安市市屬事業(yè)單位考試及答案
- 落實(shí)信息工作相關(guān)制度
- 綠城管理的五大制度
- VMware替代詳解方案及最佳實(shí)踐(企業(yè)云平臺篇)
- DB4114T 105-2019 黃河故道地區(qū)蘋果化學(xué)疏花疏果技術(shù)規(guī)程
- 如何高效向GPT提問
- JT-T-969-2015路面裂縫貼縫膠
- 無抗養(yǎng)殖模式可行性分析
- 《常見疾病康復(fù)》課程教學(xué)大綱
- 飼料廠HACCP計劃書
- PIPESIM軟件教程(軟件介紹及模型建立)
- xx大廈舊溴化鋰制冷機(jī)中央空調(diào)拆除施工方案
- “十佳和諧社區(qū)”創(chuàng)建先進(jìn)事跡材料
- 單層工業(yè)廠房標(biāo)底
- YY/T 0708-2009醫(yī)用電氣設(shè)備第1-4部分:安全通用要求并列標(biāo)準(zhǔn):可編程醫(yī)用電氣系統(tǒng)
評論
0/150
提交評論