統(tǒng)計(jì)學(xué)例題及答案_第1頁
統(tǒng)計(jì)學(xué)例題及答案_第2頁
統(tǒng)計(jì)學(xué)例題及答案_第3頁
統(tǒng)計(jì)學(xué)例題及答案_第4頁
統(tǒng)計(jì)學(xué)例題及答案_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)例題及答案案例背景某城市統(tǒng)計(jì)局為掌握居民家庭收入分布特征及影響因素,于2023年開展了一次覆蓋全市12個(gè)城區(qū)的家庭收支抽樣調(diào)查。調(diào)查采用分層隨機(jī)抽樣方法,按城區(qū)經(jīng)濟(jì)發(fā)展水平分為高、中、低三類區(qū)域,每類區(qū)域抽取50戶家庭,最終獲得有效樣本150戶(數(shù)據(jù)經(jīng)脫敏處理)。以下基于該調(diào)查數(shù)據(jù),完成描述統(tǒng)計(jì)分析、參數(shù)估計(jì)、假設(shè)檢驗(yàn)及線性回歸分析等任務(wù)。任務(wù)一:描述統(tǒng)計(jì)分析數(shù)據(jù)說明:150戶家庭的月收入(單位:元)部分?jǐn)?shù)據(jù)如下(按升序排列):3200,3500,3800,4000,4200,4300,4500,4600,4800,5000,5200,5300,5500,5600,5800,6000,6200,6300,6500,6800,...(中間80個(gè)數(shù)據(jù)略)...,18500,19000,19500,20000要求:計(jì)算該樣本的集中趨勢(shì)指標(biāo)(均值、中位數(shù)、眾數(shù))、離散程度指標(biāo)(方差、標(biāo)準(zhǔn)差、四分位距),并繪制頻數(shù)分布直方圖(組距為2000元),分析數(shù)據(jù)分布特征。解答過程1.集中趨勢(shì)指標(biāo)計(jì)算-均值($\bar{x}$):樣本數(shù)據(jù)總和為$\sumx_i=3200+3500+...+20000=9,360,000$(通過統(tǒng)計(jì)軟件計(jì)算),樣本量$n=150$,因此:$$\bar{x}=\frac{\sumx_i}{n}=\frac{9,360,000}{150}=6240\\text{元}$$-中位數(shù)($M_e$):樣本量為偶數(shù)時(shí),中位數(shù)為第75和76個(gè)數(shù)的平均值。經(jīng)排序后,第75個(gè)數(shù)為5800元,第76個(gè)數(shù)為6000元,因此:$$M_e=\frac{5800+6000}{2}=5900\\text{元}$$-眾數(shù)($M_o$):觀察數(shù)據(jù)分布,月收入在5000-6000元區(qū)間的家庭最多(共32戶),其中5500元出現(xiàn)次數(shù)最多(8次),因此眾數(shù)為5500元。2.離散程度指標(biāo)計(jì)算-方差($s^2$):樣本方差計(jì)算公式為:$$s^2=\frac{\sum(x_i-\bar{x})^2}{n-1}$$通過計(jì)算,$\sum(x_i-6240)^2=1,248,000,000$(統(tǒng)計(jì)軟件結(jié)果),因此:$$s^2=\frac{1,248,000,000}{149}\approx8,375,838\\text{元}^2$$-標(biāo)準(zhǔn)差($s$):標(biāo)準(zhǔn)差為方差的平方根:$$s=\sqrt{8,375,838}\approx2894\\text{元}$$-四分位距($IQR$):第一四分位數(shù)($Q_1$)為第37.5個(gè)數(shù),即第37和38個(gè)數(shù)的平均值(4500和4600元),$Q_1=4550$元;第三四分位數(shù)($Q_3$)為第112.5個(gè)數(shù),即第112和113個(gè)數(shù)的平均值(7800和8000元),$Q_3=7900$元;因此,$IQR=Q_3-Q_1=7900-4550=3350$元。3.頻數(shù)分布直方圖組距設(shè)為2000元,分組如下:-3000-5000元:25戶(頻數(shù))-5000-7000元:55戶-7000-9000元:40戶-9000-11000元:20戶-11000-13000元:8戶-13000-15000元:2戶-15000-17000元:0戶-17000-19000元:0戶-19000-21000元:0戶(注:實(shí)際最高收入為20000元,單獨(dú)計(jì)入最后一組)分布特征分析:數(shù)據(jù)呈現(xiàn)右偏態(tài)(均值6240元>中位數(shù)5900元),說明存在少數(shù)高收入家庭拉高均值;主要收入集中在5000-7000元區(qū)間(占比36.7%),低收家庭(<5000元)占16.7%,高收入家庭(>9000元)占13.3%,整體分布較為分散(標(biāo)準(zhǔn)差2894元)。任務(wù)二:總體均值的區(qū)間估計(jì)背景:已知該城市共有家庭約120萬戶,抽樣調(diào)查的樣本均值為6240元,樣本標(biāo)準(zhǔn)差為2894元。要求:以95%的置信水平估計(jì)該城市家庭月收入的總體均值。解答過程1.確定統(tǒng)計(jì)量:由于總體標(biāo)準(zhǔn)差未知且樣本量$n=150$(大樣本),可用樣本標(biāo)準(zhǔn)差$s$代替總體標(biāo)準(zhǔn)差$\sigma$,采用$t$分布(或近似$z$分布)。2.計(jì)算邊際誤差($E$):置信水平95%,自由度$df=n-1=149$,查$t$分布表得$t_{\alpha/2}=1.976$(近似$z=1.96$)。邊際誤差公式為:$$E=t_{\alpha/2}\cdot\frac{s}{\sqrt{n}}$$代入數(shù)據(jù):$$E=1.976\cdot\frac{2894}{\sqrt{150}}\approx1.976\cdot236.7\approx468\\text{元}$$3.置信區(qū)間:總體均值$\mu$的95%置信區(qū)間為:$$\bar{x}\pmE=6240\pm468$$即(5772元,6708元)。任務(wù)三:假設(shè)檢驗(yàn)——收入是否高于全國(guó)平均背景:據(jù)國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù),2023年全國(guó)城鎮(zhèn)居民家庭月收入均值為6000元。要求:檢驗(yàn)該城市家庭月收入是否顯著高于全國(guó)平均水平(顯著性水平$\alpha=0.05$)。解答過程1.提出假設(shè):原假設(shè)$H_0:\mu\leq6000$(該城市收入不高于全國(guó)平均);備擇假設(shè)$H_1:\mu>6000$(該城市收入顯著高于全國(guó)平均)。2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量:由于總體標(biāo)準(zhǔn)差未知且大樣本,使用$t$統(tǒng)計(jì)量(或$z$統(tǒng)計(jì)量):$$t=\frac{\bar{x}-\mu_0}{s/\sqrt{n}}=\frac{6240-6000}{2894/\sqrt{150}}\approx\frac{240}{236.7}\approx1.014$$3.確定臨界值或$p$值:?jiǎn)蝹?cè)檢驗(yàn),$\alpha=0.05$,自由度149,查$t$分布表得臨界值$t_{0.05}=1.655$(或$z_{0.05}=1.645$)。計(jì)算得$t=1.014<1.655$,因此不拒絕原假設(shè);或計(jì)算$p$值(通過統(tǒng)計(jì)軟件)約為0.156>0.05,同樣不拒絕$H_0$。4.結(jié)論:在5%的顯著性水平下,沒有足夠證據(jù)表明該城市家庭月收入顯著高于全國(guó)平均水平。任務(wù)四:線性回歸分析——家庭人口數(shù)對(duì)收入的影響背景:調(diào)查中同時(shí)記錄了每戶家庭的人口數(shù)($x$,單位:人),部分?jǐn)?shù)據(jù)如下(與收入$y$元對(duì)應(yīng)):(2,5000),(3,6200),(2,4800),(4,7500),(1,3500),(3,6000),(5,9000),...(共150組數(shù)據(jù))要求:建立月收入$y$關(guān)于家庭人口數(shù)$x$的線性回歸模型,檢驗(yàn)?zāi)P惋@著性,解釋回歸系數(shù)意義,并計(jì)算決定系數(shù)$R^2$。解答過程1.計(jì)算基本統(tǒng)計(jì)量:-樣本均值:$\bar{x}=3.2$人,$\bar{y}=6240$元;-協(xié)方差:$Cov(x,y)=\frac{\sum(x_i-\bar{x})(y_i-\bar{y})}{n-1}=1200$(統(tǒng)計(jì)軟件結(jié)果);-樣本方差:$s_x^2=\frac{\sum(x_i-\bar{x})^2}{n-1}=1.8$(人口數(shù)方差)。2.估計(jì)回歸系數(shù):斜率$b_1=\frac{Cov(x,y)}{s_x^2}=\frac{1200}{1.8}\approx666.67$;截距$b_0=\bar{y}-b_1\bar{x}=6240-666.67\times3.2\approx6240-2133.34=4106.66$;回歸方程:$\hat{y}=4106.66+666.67x$。3.模型顯著性檢驗(yàn)($F$檢驗(yàn)):-總平方和$SST=\sum(y_i-\bar{y})^2=1,248,000,000$;-回歸平方和$SSR=b_1^2\cdot(n-1)s_x^2=666.67^2\times149\times1.8\approx118,000,000$;-殘差平方和$SSE=SST-SSR=1,248,000,000-118,000,000=1,130,000,000$;-均方回歸$MSR=SSR/1=118,000,000$;-均方殘差$MSE=SSE/(n-2)=1,130,000,000/148\approx7,635,135$;-$F$統(tǒng)計(jì)量:$F=MSR/MSE=118,000,000/7,635,135\approx15.45$;-臨界值:$F_{0.05}(1,148)\approx3.90$($F$分布表),由于$15.45>3.90$,拒絕原假設(shè),模型整體顯著。4.回歸系數(shù)顯著性檢驗(yàn)($t$檢驗(yàn)):斜率$b_1$的標(biāo)準(zhǔn)誤$SE(b_1)=\sqrt{\frac{MSE}{(n-1)s_x^2}}=\sqrt{\frac{7,635,135}{149\times1.8}}\approx\sqrt{28,400}\approx168.5$;$t$統(tǒng)計(jì)量:$t=\frac{b_1}{SE(b_1)}=\frac{666.67}{168.5}\approx3.95$;自由度148,$\alpha=0.05$時(shí)臨界值$t_{0.025}=1.976$,$3.95>1.976$,拒絕$H_0:b_1=0$,說明家庭人口數(shù)對(duì)收入有顯著正向影響。5.決定系數(shù)$R^2$:$$R^2=\frac{SSR}{SST}=\frac{118,000,000}{1,248,000,000}\approx0.0945$$即家庭人口數(shù)解釋了約9.45%的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論