版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025年大學(xué)《統(tǒng)計(jì)學(xué)》專業(yè)題庫(kù)——統(tǒng)計(jì)學(xué)專業(yè)實(shí)際應(yīng)用技能訓(xùn)練考試時(shí)間:______分鐘總分:______分姓名:______一、某公司人力資源部想要了解員工的工作滿意度與其工作年限、月基本工資之間的關(guān)系。隨機(jī)抽取了50名員工,收集了他們的工作年限(單位:年)、月基本工資(單位:元)以及工作滿意度評(píng)分(滿分100分)。人力資源部使用統(tǒng)計(jì)軟件對(duì)數(shù)據(jù)進(jìn)行了分析,部分輸出結(jié)果如下:*變量描述:*工作年限(X1)*月基本工資(X2)*工作滿意度(Y)*簡(jiǎn)單統(tǒng)計(jì)量:*X1:均值=5.2年,標(biāo)準(zhǔn)差=3.1年*X2:均值=8000元,標(biāo)準(zhǔn)差=2000元*Y:均值=75分,標(biāo)準(zhǔn)差=9分*相關(guān)系數(shù)矩陣:*X1與X2:r=0.45*X1與Y:r=-0.30*X2與Y:r=0.55*簡(jiǎn)單線性回歸分析結(jié)果(Y對(duì)X2):*回歸方程:Y?=60+0.06X2*回歸系數(shù)X2的t檢驗(yàn):t=3.25,p-value=0.002*模型整體F檢驗(yàn):F=27.5,p-value<0.001*決定系數(shù)R2=0.30根據(jù)以上信息,回答以下問(wèn)題:1.根據(jù)簡(jiǎn)單統(tǒng)計(jì)量,描述該樣本中員工工作年限和月基本工資的分布特征。2.根據(jù)相關(guān)系數(shù)矩陣,分析工作年限、月基本工資與工作滿意度之間大致存在怎樣的線性關(guān)系?3.解釋簡(jiǎn)單線性回歸分析結(jié)果中,回歸系數(shù)X2的t檢驗(yàn)和模型整體F檢驗(yàn)的意義。4.根據(jù)Y對(duì)X2的簡(jiǎn)單線性回歸方程,解釋月基本工資每增加1000元,工作滿意度的估計(jì)值會(huì)怎樣變化?并說(shuō)明這種變化是否具有統(tǒng)計(jì)顯著性。5.考慮到月基本工資和可能存在多重共線性,如果進(jìn)一步進(jìn)行Y對(duì)X1和X2的多元線性回歸分析,你預(yù)測(cè)多元回歸模型的解釋力(R2)會(huì)比簡(jiǎn)單線性回歸模型(Y對(duì)X2)的R2高還是低?請(qǐng)說(shuō)明理由。二、某醫(yī)院想知道某種藥物對(duì)降低血壓的效果。研究人員將符合特定條件的100名高血壓患者隨機(jī)分為兩組,每組50人。一組服用該藥物(處理組),另一組服用安慰劑(對(duì)照組)。經(jīng)過(guò)一個(gè)月的治療后,記錄了兩組患者的收縮壓變化量(單位:mmHg),數(shù)據(jù)如下(單位:mmHg):*處理組樣本量n1=50,收縮壓平均變化量均值為-15,標(biāo)準(zhǔn)差為10。*對(duì)照組樣本量n2=50,收縮壓平均變化量均值為-5,標(biāo)準(zhǔn)差為8。假設(shè)兩組患者的收縮壓變化量服從正態(tài)分布,且兩組方差相等。1.寫出檢驗(yàn)該藥物是否真的能有效降低血壓的原假設(shè)和備擇假設(shè)。2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值(假設(shè)使用pooledvariancet-test)。3.查找或計(jì)算對(duì)應(yīng)的p-value。4.根據(jù)一個(gè)合理的顯著性水平(例如α=0.05),做出統(tǒng)計(jì)決策,并解釋該決策的含義。5.如果實(shí)際研究中發(fā)現(xiàn)處理組與對(duì)照組的收縮壓變化量方差不相等,應(yīng)該如何進(jìn)行檢驗(yàn)?請(qǐng)簡(jiǎn)述方法名稱和基本思想。三、一家電子商務(wù)公司希望了解其網(wǎng)站用戶對(duì)不同促銷方式的偏好,以及這些偏好是否與用戶的年齡有關(guān)。公司進(jìn)行了一項(xiàng)調(diào)查,隨機(jī)訪問(wèn)了200名網(wǎng)站用戶,詢問(wèn)他們更傾向于哪種促銷方式:A(折扣)、B(滿減)、C(贈(zèng)品)。同時(shí),記錄了用戶的年齡段(青年組:18-30歲,中年組:31-45歲,老年組:46歲及以上)。部分調(diào)查結(jié)果整理如下:*總樣本量:200*偏好A的人數(shù):60*偏好B的人數(shù):65*偏好C的人數(shù):75*青年組總?cè)藬?shù):70,其中偏好A:25,偏好B:30,偏好C:15*中年組總?cè)藬?shù):80,其中偏好A:20,偏好B:35,偏好C:25*老年組總?cè)藬?shù):50,其中偏好A:15,偏好B:10,偏好C:251.為了檢驗(yàn)不同促銷方式之間是否存在顯著差異(不考慮年齡因素),應(yīng)該使用什么統(tǒng)計(jì)方法?請(qǐng)簡(jiǎn)述該方法的基本原理。2.執(zhí)行上述檢驗(yàn),計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值和對(duì)應(yīng)的p-value。3.做出統(tǒng)計(jì)決策(假設(shè)α=0.05),并解釋該決策的含義。4.為了檢驗(yàn)用戶年齡組別與促銷方式偏好之間是否存在關(guān)聯(lián),應(yīng)該使用什么統(tǒng)計(jì)方法?請(qǐng)簡(jiǎn)述該方法的基本原理。5.執(zhí)行上述檢驗(yàn),計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值和對(duì)應(yīng)的p-value。6.做出統(tǒng)計(jì)決策(假設(shè)α=0.05),并解釋該決策的含義。根據(jù)結(jié)果,該公司可以得出什么結(jié)論?四、某連鎖超市想分析其銷售額(Y,單位:萬(wàn)元)與其廣告投入(X1,單位:萬(wàn)元)以及商店面積(X2,單位:平方米)之間的關(guān)系。收集了15家分店過(guò)去一年的數(shù)據(jù),并使用統(tǒng)計(jì)軟件進(jìn)行了多元線性回歸分析,得到以下部分結(jié)果:*回歸方程:Y?=20+5X1+0.08X2*回歸系數(shù)檢驗(yàn)(t值):t(X1)=4.50,t(X2)=2.10*回歸系數(shù)檢驗(yàn)(p值):p(X1)=0.001,p(X2)=0.05*模型整體檢驗(yàn)(F值):F=25.0*模型整體檢驗(yàn)(p值):p(F)=0.001*決定系數(shù)R2=0.751.根據(jù)回歸方程,解釋廣告投入每增加1萬(wàn)元,在商店面積不變的情況下,超市銷售額的估計(jì)值會(huì)怎樣變化?這種變化是否具有統(tǒng)計(jì)顯著性?2.解釋模型整體檢驗(yàn)(F檢驗(yàn))的意義,并根據(jù)其p值判斷模型的整體解釋力是否顯著。3.計(jì)算多重共線性調(diào)整后的決定系數(shù)R2adj。簡(jiǎn)要說(shuō)明R2adj相比R2的意義。4.假設(shè)有一家新開(kāi)業(yè)的分店,計(jì)劃投入廣告費(fèi)2萬(wàn)元,擁有500平方米的面積。根據(jù)上述回歸方程,估計(jì)其銷售額的均值和置信區(qū)間(要求寫出計(jì)算公式或過(guò)程,無(wú)需具體數(shù)值結(jié)果)。5.在此模型中,如果發(fā)現(xiàn)廣告投入(X1)與商店面積(X2)之間的相關(guān)系數(shù)r=0.80,這可能意味著什么問(wèn)題?簡(jiǎn)要說(shuō)明。五、一家制造企業(yè)想要監(jiān)控其生產(chǎn)線上的產(chǎn)品合格率。歷史上,該產(chǎn)品的平均合格率為95%,合格率的標(biāo)準(zhǔn)差未知?,F(xiàn)在,企業(yè)引入了一項(xiàng)新的生產(chǎn)工藝,希望檢驗(yàn)該工藝是否提高了產(chǎn)品合格率。為了檢驗(yàn)這一點(diǎn),他們對(duì)采用新工藝生產(chǎn)的產(chǎn)品進(jìn)行了隨機(jī)抽樣檢查。抽取了200件產(chǎn)品,其中有185件合格。1.寫出檢驗(yàn)新生產(chǎn)工藝是否確實(shí)提高了產(chǎn)品合格率的原假設(shè)和備擇假設(shè)。2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值(使用z檢驗(yàn))。3.查找或計(jì)算對(duì)應(yīng)的p-value。4.根據(jù)一個(gè)合理的顯著性水平(例如α=0.05),做出統(tǒng)計(jì)決策,并解釋該決策的含義。5.計(jì)算合格率的95%置信區(qū)間。6.如果樣本量增大到2000件,而合格件數(shù)仍然是185件,你預(yù)計(jì)檢驗(yàn)統(tǒng)計(jì)量的值會(huì)怎樣變化?為什么?這種變化對(duì)檢驗(yàn)的效力(power)有何影響?六、某研究機(jī)構(gòu)想要了解居民的在線購(gòu)物習(xí)慣與其年齡、教育程度和月收入的關(guān)系。他們收集了300名居民的樣本數(shù)據(jù),其中包括年齡(X1,單位:歲)、教育程度(X2,有“低”、“中”、“高”三個(gè)類別)、月收入(X3,單位:元)以及在線購(gòu)物頻率(Y,分為“低”、“中”、“高”三個(gè)等級(jí))。研究機(jī)構(gòu)希望建立一個(gè)模型來(lái)預(yù)測(cè)居民的在線購(gòu)物頻率。1.變量Y(在線購(gòu)物頻率)是什么類型的變量?對(duì)于這種類型的變量,建立簡(jiǎn)單的線性回歸模型是否合適?為什么?2.請(qǐng)?zhí)岢鲋辽賰煞N適用于分析這種類型因變量和多個(gè)自變量之間關(guān)系的方法,并簡(jiǎn)要說(shuō)明其基本思想。3.如果選擇使用其中一種方法進(jìn)行分析,在解釋模型結(jié)果時(shí),需要注意哪些方面,與解釋連續(xù)型因變量的回歸模型結(jié)果有何不同?4.假設(shè)研究機(jī)構(gòu)最終選擇使用logistic回歸模型進(jìn)行分析,模型結(jié)果顯示月收入(X3)的回歸系數(shù)顯著為正。請(qǐng)解釋這意味著什么。5.在線購(gòu)物頻率(Y)是一個(gè)有序變量。如果將其視為分類變量進(jìn)行分析,與將其視為有序變量進(jìn)行分析,結(jié)果可能會(huì)有何不同?請(qǐng)簡(jiǎn)要說(shuō)明。試卷答案一、1.員工工作年限的均值為5.2年,標(biāo)準(zhǔn)差為3.1年,表明樣本中員工的工作年限集中在其均值附近,但存在一定的分散性。大部分員工的工作年限在(5.2-3.1,5.2+3.1)即2.1年到8.3年之間。月基本工資的均值為8000元,標(biāo)準(zhǔn)差為2000元,說(shuō)明樣本中員工的月基本工資也集中在其均值附近,同樣存在一定程度的變異。大部分員工的月基本工資在(8000-2000,8000+2000)即6000元到10000元之間。2.相關(guān)系數(shù)矩陣顯示,工作年限(X1)與工作滿意度(Y)之間存在負(fù)相關(guān)關(guān)系(r=-0.30),表明工作年限越長(zhǎng),工作滿意度可能越低。月基本工資(X2)與工作滿意度(Y)之間存在正相關(guān)關(guān)系(r=0.55),表明月基本工資越高,工作滿意度可能越高。工作年限(X1)與月基本工資(X2)之間存在中等強(qiáng)度的正相關(guān)關(guān)系(r=0.45),表明工作年限越長(zhǎng),月基本工資可能越高。3.簡(jiǎn)單線性回歸分析中,回歸系數(shù)X2的t檢驗(yàn)的t統(tǒng)計(jì)量用于檢驗(yàn)月基本工資對(duì)工作滿意度的影響是否顯著異于零。t值=3.25,p-value=0.002<0.05,表明在月基本工資對(duì)工作滿意度的影響上,統(tǒng)計(jì)顯著。模型整體F檢驗(yàn)的F統(tǒng)計(jì)量用于檢驗(yàn)整個(gè)回歸模型(僅包含月基本工資X2)的整體解釋力是否顯著異于零。F值=27.5,p-value<0.001,表明該回歸模型的整體解釋力是顯著的。4.根據(jù)回歸方程Y?=60+0.06X2,月基本工資每增加1元,工作滿意度的估計(jì)值會(huì)增加0.06分。因?yàn)樵禄竟べY每增加1000元,工作滿意度的估計(jì)值會(huì)增加0.06*1000=60分。這種變化具有統(tǒng)計(jì)顯著性,因?yàn)樵禄竟べY的t檢驗(yàn)p-value=0.002<0.05。5.預(yù)測(cè)多元回歸模型的解釋力(R2)會(huì)高于簡(jiǎn)單線性回歸模型(Y對(duì)X2)的R2。理由是:簡(jiǎn)單線性回歸模型中,月基本工資(X2)與工作滿意度(Y)的相關(guān)系數(shù)為0.55。根據(jù)多重共線性理論,當(dāng)將另一個(gè)與自變量X2相關(guān)的自變量(如工作年限X1)加入到多元回歸模型中時(shí),模型的R2通常會(huì)增大,除非X1與X2完全線性相關(guān)。因?yàn)閄1與X2的相關(guān)系數(shù)為0.45,存在一定程度的相關(guān)性,所以加入X1后,模型能解釋更多關(guān)于Y的變異,R2會(huì)提高。二、1.原假設(shè)H0:處理組的平均收縮壓變化量等于對(duì)照組的平均收縮壓變化量,即μ1=μ2(或μd=0)。備擇假設(shè)H1:處理組的平均收縮壓變化量小于對(duì)照組的平均收縮壓變化量,即μ1<μ2(或μd<0)。2.使用pooledvariancet-test,檢驗(yàn)統(tǒng)計(jì)量t=(mean1-mean2)/sqrt(s_p^2*(1/n1+1/n2)),其中s_p^2是合并方差,s_p^2=((n1-1)s1^2+(n2-1)s2^2)/(n1+n2-2)。計(jì)算得到s_p^2=((50-1)*10^2+(50-1)*8^2)/(50+50-2)=(4900+3136)/98=8036/98≈81.8367。s_p≈9.046。t=(-15-(-5))/sqrt(81.8367*(1/50+1/50))=-10/sqrt(81.8367*0.04)=-10/sqrt(3.273468)≈-10/1.807=-5.525。3.查t分布表,自由度df=n1+n2-2=98,單尾檢驗(yàn),t=-5.525的p-value遠(yuǎn)小于0.001。4.根據(jù)p-value<α=0.05,拒絕原假設(shè)。決策含義:有足夠的統(tǒng)計(jì)證據(jù)表明該藥物能有效降低高血壓患者的收縮壓(處理組的平均收縮壓變化量顯著低于對(duì)照組)。5.如果發(fā)現(xiàn)處理組與對(duì)照組的收縮壓變化量方差不相等,應(yīng)該使用Welch'st-test(或稱為不等方差t檢驗(yàn))?;舅枷胧?,該方法不要求兩組方差相等,它使用一個(gè)基于兩組樣本方差估計(jì)值且權(quán)重與樣本量相關(guān)的公式來(lái)計(jì)算檢驗(yàn)統(tǒng)計(jì)量,從而適用于方差不等的情況。三、1.為了檢驗(yàn)不同促銷方式之間是否存在顯著差異(不考慮年齡因素),應(yīng)該使用單因素方差分析(One-wayANOVA)?;驹硎潜容^三個(gè)(或多個(gè))組的均值是否存在顯著差異,通過(guò)檢驗(yàn)組間方差與組內(nèi)方差的比率是否足夠大,來(lái)判斷不同組的均值是否相等。2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F=MS_between/MS_within。MS_between=Σ(n_i*(mean_i-mean_total)^2)/k-1,其中mean_total=ΣΣY_ij/N。mean_total=(60+65+75)/200=200/200=1.0。MS_between=(70*(0.357-1.0)^2+80*(0.438-1.0)^2+50*(0.5-1.0)^2)/3-1=(70*0.4169+80*0.3169+50*0.25)/3-1=(29.183+25.352+12.5)/3-1=66.035/3-1=22.0117-1=21.0117。MS_within=Σ(n_i*s_i^2)/(N-k)=(70*0.05625+80*0.03515+50*0.05625)/(200-3)=(3.9375+2.812+2.8125)/197=9.562/197≈0.0486。F=21.0117/0.0486≈432.9。計(jì)算p-value:查F分布表,df_between=2,df_within=197,F(xiàn)=432.9的p-value極小,遠(yuǎn)小于0.001。3.做出統(tǒng)計(jì)決策:根據(jù)p-value<α=0.05,拒絕原假設(shè)。決策含義:有足夠的統(tǒng)計(jì)證據(jù)表明,至少存在一種促銷方式,其被偏好的比例與其他方式存在顯著差異。4.為了檢驗(yàn)用戶年齡組別與促銷方式偏好之間是否存在關(guān)聯(lián),應(yīng)該使用卡方獨(dú)立性檢驗(yàn)(Chi-squaredTestforIndependence)?;驹硎菣z驗(yàn)兩個(gè)分類變量之間是否相互獨(dú)立,通過(guò)比較觀測(cè)頻數(shù)與期望頻數(shù)(基于行和列邊際總和計(jì)算的頻數(shù))的差異來(lái)判斷。計(jì)算檢驗(yàn)統(tǒng)計(jì)量χ2=Σ((O_ij-E_ij)^2/E_ij),其中O_ij是觀測(cè)頻數(shù),E_ij是期望頻數(shù)。計(jì)算期望頻數(shù):E_A=(60+20+15)/200*70=95/200*70=0.475*70=33.25E_B=(65+35+10)/200*70=110/200*70=0.55*70=38.5E_C=(75+25+25)/200*70=125/200*70=0.625*70=43.75E_A=(60+20+15)/200*80=95/200*80=0.475*80=38E_B=(65+35+10)/200*80=110/200*80=0.55*80=44E_C=(75+25+25)/200*80=125/200*80=0.625*80=50E_A=(60+20+15)/200*50=95/200*50=0.475*50=23.75E_B=(65+35+10)/200*50=110/200*50=0.55*50=27.5E_C=(75+25+25)/200*50=125/200*50=0.625*50=31.25χ2=((25-33.25)^2/33.25)+((30-38.5)^2/38.5)+((15-43.75)^2/43.75)+((20-38)^2/38)+((35-44)^2/44)+((25-50)^2/50)+((15-23.75)^2/23.75)+((10-27.5)^2/27.5)+((25-31.25)^2/31.25)χ2≈(6.25/33.25)+(72.25/38.5)+(722.56/43.75)+(324/38)+(121/44)+(625/50)+(76.56/23.75)+(306.25/27.5)+(35.16/31.25)χ2≈0.188+1.868+16.481+8.526+2.75+12.5+3.238+11.16+1.125≈60.34查χ2分布表,df=(行數(shù)-1)*(列數(shù)-1)=(3-1)*(3-1)=4,χ2=60.34的p-value極小,遠(yuǎn)小于0.001。5.做出統(tǒng)計(jì)決策:根據(jù)p-value<α=0.05,拒絕原假設(shè)。決策含義:有足夠的統(tǒng)計(jì)證據(jù)表明,用戶年齡組別與促銷方式偏好之間存在顯著關(guān)聯(lián)。結(jié)論:不同年齡段的用戶在促銷方式偏好上存在差異。6.根據(jù)結(jié)果,該公司可以得出結(jié)論:用戶年齡是影響其促銷方式偏好的一個(gè)重要因素,不同年齡段的用戶群體適合不同的促銷策略。例如,老年組可能更偏好贈(zèng)品,中年組可能偏好滿減,青年組可能偏好折扣。四、1.根據(jù)回歸方程Y?=20+5X1+0.08X2,廣告投入每增加1萬(wàn)元,在商店面積不變的情況下,超市銷售額的估計(jì)值會(huì)增加5萬(wàn)元。廣告投入的t檢驗(yàn)t(X1)=4.50,對(duì)應(yīng)的p-value=0.001<0.05,表明這種變化是具有統(tǒng)計(jì)顯著性的。2.模型整體檢驗(yàn)(F檢驗(yàn))的意義是檢驗(yàn)整個(gè)回歸模型(包含廣告投入X1和商店面積X2)的整體解釋力是否顯著異于零。F值=25.0,對(duì)應(yīng)的p-value=0.001<0.05,表明該回歸模型的整體解釋力是顯著的,即廣告投入和商店面積共同對(duì)銷售額有顯著的線性影響。3.R2adj=1-(SSE/(n-k-1))/(SST/(n-1))。R2=1-SSE/SST=1-(1-R2)/(1+R2)=R/(1+R)。R2adj=1-[(1-R2)/(1+R2)]*[(n-1)/(n-k-1)]=R2/[1+(k-1)R2/(n-k-1)]。計(jì)算公式為:R2adj=0.75/[1+(2-1)*0.75/(15-2-1)]=0.75/[1+0.75/12]=0.75/[1+0.0625]=0.75/1.0625≈0.7053。R2adj相比R2的意義在于,它考慮了模型中自變量的個(gè)數(shù),當(dāng)增加不顯著的自變量時(shí),R2會(huì)增大但R2adj通常會(huì)減小或不變。R2adj更能反映模型對(duì)數(shù)據(jù)變異的真實(shí)解釋能力。4.估計(jì)銷售額的均值E(Y)=β0+β1X1+β2X2=20+5*2+0.08*500=20+10+40=70萬(wàn)元。對(duì)于均值估計(jì),使用樣本標(biāo)準(zhǔn)誤SE(Y?)=sqrt(MSE*(1/n+(X1?-X?)2/Σ(xi-x?)2?+(X2?-X?)2/Σ(xi-x?)2?)),其中MSE=SSE/(n-k-1)=(1-R2)/(n-k-1)=(1-0.75)/(15-2-1)=0.25/12≈0.0208。需要樣本均值X?,Σ(xi-x?)2?,Σ(xi-x?)2?。假設(shè)這些值已知(或題目中隱含),則可計(jì)算SE(Y?)。置信區(qū)間為E(Y)±t*(SE(Y?)),t值基于α/2和n-k-1自由度。計(jì)算公式為:70±t*(sqrt(MSE*(1/n+(2-X?)2/Σ(xi-x?)2?+(500-X?)2/Σ(xi-x?)2?)))。無(wú)需具體數(shù)值結(jié)果。5.如果廣告投入(X1)與商店面積(X2)之間的相關(guān)系數(shù)r=0.80,這可能意味著存在多重共線性問(wèn)題。多重共線性是指模型中的自變量之間存在高度線性相關(guān)。其后果是:系數(shù)估計(jì)值的方差增大,導(dǎo)致t檢驗(yàn)統(tǒng)計(jì)量減小,p值增大,難以判斷單個(gè)自變量的獨(dú)立影響是否顯著;系數(shù)估計(jì)值的符號(hào)可能與預(yù)期相反;模型預(yù)測(cè)可能不穩(wěn)定。r=0.80是一個(gè)較強(qiáng)的相關(guān)系數(shù),表明X1和X2之間存在較強(qiáng)的線性關(guān)系,很可能導(dǎo)致多重共線性問(wèn)題。五、1.原假設(shè)H0:新生產(chǎn)工藝的平均合格率等于歷史平均合格率,即p=0.95。備擇假設(shè)H1:新生產(chǎn)工藝的平均合格率高于歷史平均合格率,即p>0.95。2.使用大樣本z檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量z=(p?-p)/sqrt(p(1-p)/n),其中p?=x/n=185/200=0.925。z=(0.925-0.95)/sqrt(0.95*(1-0.95)/200)=-0.025/sqrt(0.0475/200)=-0.025/sqrt(0.0002375)=-0.025/0.0154≈-1.623。3.查標(biāo)準(zhǔn)正態(tài)分布表,單尾檢驗(yàn),z=-1.623的p-value=P(Z<-1.623)≈0.0529?;蛘呤褂?-P(Z<1.623)≈1-0.9463=0.0537。這里取0.0539。4.根據(jù)p-value=0.0539>α=0.05,不拒絕原假設(shè)。決策含義:沒(méi)有足夠的統(tǒng)計(jì)證據(jù)表明新生產(chǎn)工藝確實(shí)提高了產(chǎn)品合格率。5.合格率的95%置信區(qū)間為p?±z*(sqrt(p?(1-p?)/n))。z值對(duì)應(yīng)于α/2=0.025的雙尾檢驗(yàn),為1.96。區(qū)間=0.925±1.96*sqrt(0.925*(1-0.925)/200)=0.925±1.96*sqrt(0.0475/200)=0.925±1.96*0.0154=0.925±0.0304。區(qū)間約為(0.8946,0.9554)。6.如果樣本量增大到n=2000,而合格件數(shù)仍然是x=185件,則樣本合格率p?=185/2000=0.0925。檢驗(yàn)統(tǒng)計(jì)量z=(0.0925-0.95)/sqrt(0.95*(1-0.95)/2000)=-0.8575/sqrt(0.0475/2000)=-0.8575/sqrt(0.00002375)=-0.8575/0.00487≈-176.0。z值的絕對(duì)值會(huì)顯著增大。由于是單尾檢驗(yàn)(p>0.95),z=-176.0遠(yuǎn)遠(yuǎn)小于0,對(duì)應(yīng)的p-value將極其接近0,遠(yuǎn)小于任何常規(guī)的顯著性水平(如0.05)。因此,檢驗(yàn)的效力(power)會(huì)大大增強(qiáng),幾乎肯定能夠檢測(cè)出合格率與0.95之間的顯著差異(如果存在的話),或者更容易拒絕原假設(shè)。六、1.變量Y(在線購(gòu)物頻率)是分類變量(有序變量),具體分為“低”、“中”、“高”三個(gè)等級(jí)。對(duì)于這種類型的變量,建立簡(jiǎn)單的線性回歸模型(預(yù)測(cè)連續(xù)變量)是不合適的,因?yàn)槟P偷妮敵鍪沁B續(xù)的,而Y是分類的,無(wú)法直接比較預(yù)測(cè)值與實(shí)際類別。2.適用于分析這種類型因變量和多個(gè)自變量之間關(guān)系的方法有:*有序邏輯回歸(OrdinalLogisticRegressio
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年派往市委某工作機(jī)關(guān)駕駛員、文印員崗位工作人員招聘?jìng)淇碱}庫(kù)及答案詳解1套
- 上海電子備考題庫(kù)職業(yè)技術(shù)學(xué)院2025年度派遣制人員招聘?jìng)淇碱}庫(kù)(第六批次)參考答案詳解
- 2026年龍華醫(yī)院新職工招聘?jìng)淇碱}庫(kù)(第五批)附答案詳解
- 2026年蘇州中材建設(shè)有限公司招聘?jìng)淇碱}庫(kù)參考答案詳解
- 2026年財(cái)達(dá)證券股份有限公司資產(chǎn)管理業(yè)務(wù)委員會(huì)招聘?jìng)淇碱}庫(kù)帶答案詳解
- 2026年陽(yáng)春市中醫(yī)院合同制員工(第三批)招聘?jìng)淇碱}庫(kù)及一套答案詳解
- 2026年沈陽(yáng)工學(xué)院招聘?jìng)淇碱}庫(kù)完整參考答案詳解
- 中醫(yī)診所醫(yī)療垃圾處理制度
- 天津市西青醫(yī)院2025年面向社會(huì)公開(kāi)招聘編外高層次和外派站點(diǎn)專業(yè)技術(shù)人員備考題庫(kù)及1套參考答案詳解
- 養(yǎng)老院信息化建設(shè)及管理規(guī)范制度
- 代貼現(xiàn)服務(wù)合同范本
- 2025小學(xué)六年級(jí)英語(yǔ)時(shí)態(tài)綜合練習(xí)卷
- 垃圾清運(yùn)補(bǔ)充合同范本
- 2026屆湖南省長(zhǎng)沙市長(zhǎng)郡集團(tuán)九年級(jí)物理第一學(xué)期期末預(yù)測(cè)試題含解析
- 九年級(jí)上學(xué)期數(shù)學(xué)壓軸必考題型-反比例函數(shù)(含答案)
- 上海市旅館從業(yè)人員考試及答案解析
- 生日主題宴會(huì)設(shè)計(jì)方案
- 《JJG 1081.1-2024鐵路機(jī)車車輛輪徑量具檢定規(guī)程 第1部分:輪徑尺》 解讀
- 《基坑圍護(hù)結(jié)構(gòu)滲漏檢測(cè)技術(shù)標(biāo)準(zhǔn)》
- 代辦營(yíng)業(yè)執(zhí)照合同模板范文
- 職業(yè)教育示范性教師教學(xué)創(chuàng)新團(tuán)隊(duì)建設(shè)方案
評(píng)論
0/150
提交評(píng)論