版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025年統(tǒng)計(jì)學(xué)專(zhuān)業(yè)期末考試:數(shù)據(jù)分析計(jì)算題庫(kù)與數(shù)據(jù)挖掘考試時(shí)間:______分鐘總分:______分姓名:______一、描述統(tǒng)計(jì)計(jì)算要求:請(qǐng)根據(jù)以下給出的數(shù)據(jù),完成以下描述統(tǒng)計(jì)計(jì)算。已知某班級(jí)學(xué)生的期末考試成績(jī)?nèi)缦拢▎挝唬悍郑?0,82,75,60,68,95,88,90,72,65,78,85,76,89,93,77,64,80,67,91。1.計(jì)算這組數(shù)據(jù)的平均數(shù)。2.計(jì)算這組數(shù)據(jù)的眾數(shù)。3.計(jì)算這組數(shù)據(jù)的極差。4.計(jì)算這組數(shù)據(jù)的中位數(shù)。5.計(jì)算這組數(shù)據(jù)的方差。6.計(jì)算這組數(shù)據(jù)的標(biāo)準(zhǔn)差。7.計(jì)算這組數(shù)據(jù)的四分位數(shù)Q1、Q2和Q3。8.計(jì)算這組數(shù)據(jù)的偏度。9.計(jì)算這組數(shù)據(jù)的峰度。10.將這組數(shù)據(jù)從小到大排序。二、概率論計(jì)算要求:請(qǐng)根據(jù)以下給出的條件,完成以下概率論計(jì)算。假設(shè)一個(gè)盒子里有5個(gè)紅球和3個(gè)藍(lán)球,隨機(jī)從中取出兩個(gè)球。1.計(jì)算取出的兩個(gè)球都是紅球的概率。2.計(jì)算取出的兩個(gè)球中至少有一個(gè)紅球的概率。3.計(jì)算取出的兩個(gè)球都是藍(lán)球的概率。4.計(jì)算取出的兩個(gè)球中至少有一個(gè)藍(lán)球的概率。5.計(jì)算取出的第一個(gè)球是紅球,第二個(gè)球是藍(lán)球的概率。6.計(jì)算取出的第一個(gè)球是紅球,第二個(gè)球是紅球的概率。7.計(jì)算取出的第一個(gè)球是藍(lán)球,第二個(gè)球是紅球的概率。8.計(jì)算取出的第一個(gè)球是藍(lán)球,第二個(gè)球是藍(lán)球的概率。9.計(jì)算取出的兩個(gè)球都是同一種顏色的概率。10.計(jì)算取出的兩個(gè)球中,紅球和藍(lán)球各取一個(gè)的概率。三、數(shù)據(jù)挖掘要求:請(qǐng)根據(jù)以下給出的數(shù)據(jù),完成以下數(shù)據(jù)挖掘任務(wù)。某公司收集了以下顧客購(gòu)買(mǎi)記錄數(shù)據(jù):顧客ID|商品ID|購(gòu)買(mǎi)數(shù)量|購(gòu)買(mǎi)時(shí)間---|---|---|---1|101|2|2021-01-011|102|1|2021-01-022|103|3|2021-01-032|104|2|2021-01-043|105|1|2021-01-053|106|2|2021-01-064|107|3|2021-01-074|108|1|2021-01-085|109|2|2021-01-095|110|1|2021-01-101.根據(jù)購(gòu)買(mǎi)時(shí)間,對(duì)顧客進(jìn)行聚類(lèi)分析。2.根據(jù)購(gòu)買(mǎi)數(shù)量,對(duì)商品進(jìn)行聚類(lèi)分析。3.根據(jù)顧客ID,分析顧客的購(gòu)買(mǎi)行為。4.根據(jù)商品ID,分析商品的受歡迎程度。5.根據(jù)購(gòu)買(mǎi)時(shí)間,分析顧客的購(gòu)買(mǎi)趨勢(shì)。6.根據(jù)購(gòu)買(mǎi)數(shù)量,分析商品的銷(xiāo)量情況。7.根據(jù)顧客ID,分析顧客的購(gòu)買(mǎi)頻率。8.根據(jù)商品ID,分析商品的購(gòu)買(mǎi)概率。9.根據(jù)購(gòu)買(mǎi)時(shí)間,分析顧客的購(gòu)買(mǎi)習(xí)慣。10.根據(jù)購(gòu)買(mǎi)數(shù)量,分析顧客的購(gòu)買(mǎi)偏好。四、假設(shè)檢驗(yàn)要求:根據(jù)以下假設(shè)檢驗(yàn)問(wèn)題,完成相應(yīng)的計(jì)算。假設(shè)某產(chǎn)品合格率為95%,現(xiàn)從該產(chǎn)品中隨機(jī)抽取10個(gè)產(chǎn)品進(jìn)行檢驗(yàn),其中有2個(gè)不合格。請(qǐng)使用0.05的顯著性水平進(jìn)行假設(shè)檢驗(yàn),判斷該產(chǎn)品合格率是否發(fā)生了顯著變化。1.提出原假設(shè)和備擇假設(shè)。2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量。3.確定拒絕域。4.計(jì)算p值。5.根據(jù)p值判斷是否拒絕原假設(shè)。6.如果拒絕原假設(shè),說(shuō)明產(chǎn)品合格率發(fā)生了什么變化。7.如果不拒絕原假設(shè),說(shuō)明產(chǎn)品合格率是否保持不變。8.計(jì)算樣本比例。9.計(jì)算樣本比例的標(biāo)準(zhǔn)誤差。10.計(jì)算置信區(qū)間。五、線性回歸分析要求:根據(jù)以下線性回歸數(shù)據(jù),完成相應(yīng)的分析。已知某地區(qū)居民收入(Y)與教育程度(X)的線性回歸方程為:Y=5000+200X。其中,樣本數(shù)據(jù)如下:居民收入(Y)|教育程度(X)---|---30000|1040000|1235000|1142000|1333000|101.計(jì)算回歸系數(shù)b。2.計(jì)算回歸系數(shù)a。3.計(jì)算R2值。4.計(jì)算F統(tǒng)計(jì)量。5.判斷回歸模型是否顯著。6.計(jì)算教育程度對(duì)居民收入的影響。7.計(jì)算居民收入的標(biāo)準(zhǔn)誤差。8.計(jì)算教育程度的預(yù)測(cè)值。9.計(jì)算預(yù)測(cè)值的標(biāo)準(zhǔn)誤差。10.計(jì)算預(yù)測(cè)值的置信區(qū)間。六、時(shí)間序列分析要求:根據(jù)以下時(shí)間序列數(shù)據(jù),完成相應(yīng)的分析。某城市近5年的居民消費(fèi)支出(單位:萬(wàn)元)如下:年份|居民消費(fèi)支出---|---2016|8002017|8502018|9002019|9502020|10001.計(jì)算平均消費(fèi)支出。2.計(jì)算消費(fèi)支出的標(biāo)準(zhǔn)差。3.計(jì)算消費(fèi)支出的自相關(guān)系數(shù)。4.計(jì)算消費(fèi)支出的偏自相關(guān)系數(shù)。5.判斷消費(fèi)支出是否存在趨勢(shì)。6.判斷消費(fèi)支出是否存在季節(jié)性。7.判斷消費(fèi)支出是否存在周期性。8.計(jì)算消費(fèi)支出的移動(dòng)平均。9.計(jì)算消費(fèi)支出的指數(shù)平滑。10.預(yù)測(cè)2021年的居民消費(fèi)支出。本次試卷答案如下:一、描述統(tǒng)計(jì)計(jì)算1.平均數(shù)=(70+82+75+60+68+95+88+90+72+65+78+85+76+89+93+77+64+80+67+91)/20=78.12.眾數(shù):由于每個(gè)數(shù)出現(xiàn)的次數(shù)都是1次,因此沒(méi)有眾數(shù)。3.極差=最大值-最小值=95-60=354.中位數(shù):將數(shù)據(jù)從小到大排序后,位于中間的數(shù)是第10和第11個(gè)數(shù)的平均值,即(72+78)/2=755.方差=[(70-78.1)^2+(82-78.1)^2+...+(91-78.1)^2]/20=197.696.標(biāo)準(zhǔn)差=√方差=√197.69≈14.057.四分位數(shù)Q1=數(shù)據(jù)排序后第5個(gè)數(shù)=68,Q2(中位數(shù))=75,Q3=數(shù)據(jù)排序后第15個(gè)數(shù)=898.偏度=(Σ[(xi-μ)^3]/n)/(σ^3)≈0.0169.峰度=(Σ[(xi-μ)^4]/n)/(σ^4)≈0.42810.排序后的數(shù)據(jù):60,64,65,67,68,67,70,72,75,76,78,80,82,85,88,89,90,91,93,95二、概率論計(jì)算1.P(兩個(gè)紅球)=(5/8)*(4/7)=5/142.P(至少一個(gè)紅球)=1-P(兩個(gè)藍(lán)球)=1-(3/8)*(2/7)=11/143.P(兩個(gè)藍(lán)球)=(3/8)*(2/7)=3/284.P(至少一個(gè)藍(lán)球)=1-P(兩個(gè)紅球)=1-(5/8)*(4/7)=9/145.P(第一個(gè)紅球,第二個(gè)藍(lán)球)=(5/8)*(3/7)=15/566.P(第一個(gè)紅球,第二個(gè)紅球)=(5/8)*(4/7)=5/147.P(第一個(gè)藍(lán)球,第二個(gè)紅球)=(3/8)*(5/7)=15/568.P(第一個(gè)藍(lán)球,第二個(gè)藍(lán)球)=(3/8)*(2/7)=3/289.P(同一種顏色)=P(兩個(gè)紅球)+P(兩個(gè)藍(lán)球)=5/14+3/28=13/2810.P(紅球和藍(lán)球各一個(gè))=P(第一個(gè)紅球,第二個(gè)藍(lán)球)+P(第一個(gè)藍(lán)球,第二個(gè)紅球)=15/56+15/56=15/28三、數(shù)據(jù)挖掘1.聚類(lèi)分析:根據(jù)購(gòu)買(mǎi)時(shí)間進(jìn)行時(shí)間序列聚類(lèi),將顧客分為不同的購(gòu)買(mǎi)周期。2.聚類(lèi)分析:根據(jù)購(gòu)買(mǎi)數(shù)量進(jìn)行聚類(lèi),將商品分為不同的銷(xiāo)量類(lèi)別。3.購(gòu)買(mǎi)行為分析:分析每個(gè)顧客的購(gòu)買(mǎi)次數(shù)、購(gòu)買(mǎi)頻率和購(gòu)買(mǎi)偏好。4.受歡迎程度分析:分析每個(gè)商品的購(gòu)買(mǎi)次數(shù)、購(gòu)買(mǎi)頻率和購(gòu)買(mǎi)偏好。5.購(gòu)買(mǎi)趨勢(shì)分析:分析購(gòu)買(mǎi)時(shí)間的分布,識(shí)別購(gòu)買(mǎi)高峰和低谷。6.銷(xiāo)量情況分析:分析每個(gè)商品的購(gòu)買(mǎi)數(shù)量,識(shí)別暢銷(xiāo)和滯銷(xiāo)商品。7.購(gòu)買(mǎi)頻率分析:計(jì)算每個(gè)顧客的平均購(gòu)買(mǎi)頻率,識(shí)別高頻購(gòu)買(mǎi)顧客。8.購(gòu)買(mǎi)概率分析:計(jì)算每個(gè)商品的購(gòu)買(mǎi)概率,識(shí)別購(gòu)買(mǎi)概率高的商品。9.購(gòu)買(mǎi)習(xí)慣分析:分析顧客的購(gòu)買(mǎi)時(shí)間分布,識(shí)別購(gòu)買(mǎi)習(xí)慣。10.購(gòu)買(mǎi)偏好分析:分析顧客的購(gòu)買(mǎi)商品組合,識(shí)別購(gòu)買(mǎi)偏好。四、假設(shè)檢驗(yàn)1.原假設(shè)H0:產(chǎn)品合格率仍為95%備擇假設(shè)H1:產(chǎn)品合格率發(fā)生了變化2.檢驗(yàn)統(tǒng)計(jì)量=(樣本比例-總體比例)/樣本比例的標(biāo)準(zhǔn)誤差3.拒絕域:p值<0.054.p值:根據(jù)樣本比例和標(biāo)準(zhǔn)誤差計(jì)算得到5.根據(jù)p值判斷是否拒絕原假設(shè)6.如果拒絕原假設(shè),說(shuō)明產(chǎn)品合格率顯著下降7.如果不拒絕原假設(shè),說(shuō)明產(chǎn)品合格率保持不變8.樣本比例=(樣本中不合格數(shù)量/樣本總數(shù))=2/10=0.29.樣本比例的標(biāo)準(zhǔn)誤差=√[(總體比例*(1-總體比例))/樣本總數(shù)]10.置信區(qū)間:根據(jù)樣本比例和標(biāo)準(zhǔn)誤差計(jì)算得到五、線性回歸分析1.回歸系數(shù)b=∑[(xi-x?)(yi-?)]/∑[(xi-x?)^2]2.回歸系數(shù)a=?-b*x?3.R2值=∑[(yi-?)^2]/∑[(yi-y?)^2]4.F統(tǒng)計(jì)量=(R2值*n-2)/(1-R2值)*(n-2)5.判斷回歸模型是否顯著:如果F統(tǒng)計(jì)量大于臨界值,則模型顯著6.教育程度對(duì)居民收入的影響=b7.居民收入的標(biāo)準(zhǔn)誤差=√[Σ[(yi-y?)^2]/(n-2)]8.教育程度的預(yù)測(cè)值=a+b*X9.預(yù)測(cè)值的標(biāo)準(zhǔn)誤差=√[Σ[(yi-y?)^2]/(n-2)]10.預(yù)測(cè)值的置信區(qū)間:根據(jù)預(yù)測(cè)值和標(biāo)準(zhǔn)誤差計(jì)算得到六、時(shí)間序列分析1.平均消費(fèi)支出=(800+850+900+950+1000)/5=9102.消費(fèi)支出的標(biāo)準(zhǔn)差=√[Σ[(xi-μ)^2]/(n-1)]3.消費(fèi)支出的自相關(guān)系數(shù)=Σ[(xi-μ)(xi-k-μ)]/(n-k)/[Σ[(xi-μ)^2]/(n-1)]4.消費(fèi)支出的偏自相關(guān)系數(shù)=Σ[(xi-μ)(xi-k-μ)*(xi-l-μ)]/[Σ[(xi-μ)^2]/(n-1)]*[Σ[(xi-l-μ)^2]/(n-l)]5.判斷消費(fèi)支出是
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 超重型汽車(chē)列車(chē)掛車(chē)工安全生產(chǎn)規(guī)范評(píng)優(yōu)考核試卷含答案
- 液晶顯示器件彩膜制造工操作管理考核試卷含答案
- 選礦脫水工創(chuàng)新意識(shí)評(píng)優(yōu)考核試卷含答案
- 電梯機(jī)械裝配工崗前工作能力考核試卷含答案
- 顏料化操作工風(fēng)險(xiǎn)評(píng)估強(qiáng)化考核試卷含答案
- 醫(yī)用供氣工操作安全水平考核試卷含答案
- 吸油煙機(jī)制作工操作強(qiáng)化考核試卷含答案
- 2024年河池學(xué)院輔導(dǎo)員考試筆試題庫(kù)附答案
- 2024年白銀市特崗教師筆試真題匯編附答案
- 2025寧夏回族自治區(qū)公務(wù)員考試《行測(cè)》題庫(kù)及參考答案
- 2024年部門(mén)業(yè)務(wù)主管自查自糾問(wèn)題總結(jié)及整改措施
- 烏魯木齊地區(qū)2024年高三年級(jí)第一次質(zhì)量監(jiān)測(cè)(一模)英語(yǔ)試卷(含答案)
- 六年級(jí)上冊(cè)必讀書(shū)目《童年》閱讀測(cè)試題(附答案)
- 不良事件的管理查房
- 大學(xué)生畢業(yè)論文寫(xiě)作教程全套教學(xué)課件
- 雅思閱讀總述講解
- 王洪圖黃帝內(nèi)經(jīng)80課時(shí)講稿
- 地下室消防安全制度
- 新版FMEA(AIAG-VDA)完整版PPT可編輯FMEA課件
- YY/T 0833-2020肢體加壓理療設(shè)備通用技術(shù)要求
- GB/T 5023.7-2008額定電壓450/750 V及以下聚氯乙烯絕緣電纜第7部分:二芯或多芯屏蔽和非屏蔽軟電纜
評(píng)論
0/150
提交評(píng)論