版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
版高中數學選修三第三單元《成對數據的統計分析》測試題及答案1.某校高二(3)班為了研究學生每日刷題量x(單位:題)與周測成績y(單位:分)的關系,隨機抽取10名同學,數據如下:|學生編號|1|2|3|4|5|6|7|8|9|10||----------|---|---|---|---|---|---|---|---|---|---||x|8|12|15|18|20|22|25|28|30|35||y|62|68|72|76|78|82|85|88|90|94|(1)計算x與y的相關系數r,并判斷線性相關程度的強弱(保留三位小數)。(2)建立y關于x的一元線性回歸方程,并解釋回歸系數的實際含義。(3)若某同學計劃每日刷題40題,用所得方程預測其周測成績,并給出95%置信水平下的預測區(qū)間(已知t?.???(8)=2.306,殘差標準差s=2.18)。(4)檢驗“刷題量對成績無顯著線性影響”的原假設,取顯著性水平α=0.05。(5)若將刷題量按“≤20”“21~30”“>30”分為三檔,成績按“<75”“75~85”“>85”分為三檔,列出3×3列聯表,并計算列聯系數C,判斷兩變量是否存在顯著的關聯性(χ2?.??,?=9.488)?!敬鸢概c解析】(1)n=10,Σx=213,Σy=795,Σx2=5295,Σy2=64173,Σxy=17769x?=21.3,?=79.5l??=Σx2-nx?2=5295-10×21.32=5295-4536.9=758.1l??=Σy2-n?2=64173-10×79.52=64173-63202.5=970.5l??=Σxy-nx??=17769-10×21.3×79.5=17769-16933.5=835.5r=l??/√(l??l??)=835.5/√(758.1×970.5)=835.5/857.92≈0.974|r|>0.95,故線性相關程度極強。(2)b?=l??/l??=835.5/758.1≈1.102a?=?-b?x?=79.5-1.102×21.3≈56.03回歸方程:?=56.03+1.102x含義:每日多刷1題,周測成績平均提高約1.102分。(3)x?=40,??=56.03+1.102×40≈100.11預測區(qū)間公式:??±tα/2(n-2)·s·√[1+1/n+(x?-x?)2/l??]√[1+0.1+(40-21.3)2/758.1]=√[1.1+18.72/758.1]=√[1.1+0.461]=√1.561≈1.249區(qū)間半寬=2.306×2.18×1.249≈6.28預測區(qū)間:(100.11-6.28,100.11+6.28)=(93.83,106.39)(4)H?:β?=0,t=b?/(s/√l??)=1.102/(2.18/√758.1)=1.102/0.0792≈13.91|t|>t?.???(8)=2.306,拒絕H?,刷題量對成績有顯著線性影響。(5)列聯表(實際頻數):|刷題量\成績|<75|75~85|>85|行合計||-------------|-----|-----|---|--------||≤20|2|3|0|5||21~30|0|3|2|5||>30|0|0|5|5||列合計|2|6|7|15|注:原10人樣本不足,此處按原比例放大到15人以便χ2計算,方法不變。期望頻數e??=(行i合計×列j合計)/15χ2=Σ(o-e)2/e計算得χ2≈11.34>9.488,拒絕獨立假設,存在顯著關聯。列聯系數C=√[χ2/(χ2+n)]=√[11.34/(11.34+15)]≈0.656,關聯程度中等偏強?!?.某電商平臺研究廣告投入x(萬元)與當日成交額y(萬元)的關系,連續(xù)15天的數據經初步計算得:Σx=270,Σy=3150,Σx2=5920,Σy2=721000,Σxy=62900已知回歸方程殘差平方和SSE=1820.4(1)求回歸方程?=a?+b?x。(2)計算決定系數R2,并解釋其含義。(3)對β?進行顯著性檢驗(α=0.01,t?.???,13=3.012)。(4)若第16天計劃投入25萬元,求其99%置信水平下的均值響應區(qū)間。(5)將15天數據按成交額是否超過250萬元分為“高”“低”兩檔,廣告投入是否超過20萬元分為“高”“低”兩檔,得到2×2列聯表,計算φ系數并解釋?!敬鸢概c解析】(1)n=15,x?=18,?=210l??=5920-15×182=5920-4860=1060l??=62900-15×18×210=62900-56700=6200b?=6200/1060≈5.849a?=210-5.849×18≈104.72?=104.72+5.849x(2)SST=l??=721000-15×2102=721000-661500=59500SSR=SST-SSE=59500-1820.4=57679.6R2=SSR/SST=57679.6/59500≈0.970含義:廣告投入可解釋97.0%的成交額波動,擬合效果極佳。(3)s2=SSE/(n-2)=1820.4/13≈140.03,s=11.83t=b?/(s/√l??)=5.849/(11.83/√1060)=5.849/0.363≈16.11|t|>3.012,拒絕H?,廣告投入對成交額有極顯著線性影響。(4)x?=25,??=104.72+5.849×25≈250.95均值區(qū)間半寬=tα/2·s·√[1/n+(x?-x?)2/l??]=3.012×11.83×√[1/15+(25-18)2/1060]=3.012×11.83×√(0.0667+0.0462)=3.012×11.83×0.335≈11.93區(qū)間:(250.95-11.93,250.95+11.93)=(239.02,262.88)(5)2×2表(實際頻數):|廣告\成交|高|低|合計||-----------|----|----|------||高|9|2|11||低|1|3|4||合計|10|5|15|χ2=15×(9×3-2×1)2/(11×4×10×5)=15×(27-2)2/2200=15×625/2200≈4.261φ=√(χ2/n)=√(4.261/15)≈0.533含義:廣告投入高低與成交額高低存在中等強度關聯,φ=0.533表示兩者正相關較明顯?!?.為研究手機續(xù)航時間x(小時)與用戶滿意度y(分,0~100)的關系,廠商抽取12名重度用戶,測得數據如下:x:4.2,5.0,5.5,6.0,6.5,7.0,7.5,8.0,8.5,9.0,9.5,10.0y:45,52,58,62,65,70,74,78,82,85,88,92(1)畫出散點圖,并據圖判斷采用線性模型是否合理。(2)計算Spearman秩相關系數r?,并檢驗H?:ρ?=0(α=0.05,臨界值±0.587)。(3)若發(fā)現y與x呈明顯線性趨勢,但殘差呈現“漏斗”形,請給出一種改進方案并說明理由。(4)將滿意度分為“<70”“70~85”“>85”三檔,續(xù)航分為“≤6.5”“6.6~8.5”“>8.5”三檔,構建3×3列聯表,計算Cramér’sV并解釋。(5)若定義“高滿意”為y≥80,求logistic回歸模型logit(p)=β?+β?x的最大似然估計(用Newton-Raphson一步迭代,初值β?=-10,β?=1,給出一步結果即可)?!敬鸢概c解析】(1)散點圖(略)顯示點沿直線均勻分布,無彎曲,線性模型合理。(2)對x、y分別賦秩,得:秩x:1,2,3,4,5,6,7,8,9,10,11,12秩y:1,2,3,4,5,6,7,8,9,10,11,12d?=0,r?=1-6Σd?2/[n(n2-1)]=1-0=1|r?|=1>0.587,拒絕H?,滿意度與續(xù)航秩次完全正相關。(3)殘差漏斗形提示方差非齊性,可采用加權最小二乘(WLS),權重w?=1/x?或1/x?2,亦或對y做Box-Cox變換,使方差穩(wěn)定。(4)3×3表:|續(xù)航\滿意|<70|70~85|>85|合計||-----------|----|------|----|------||≤6.5|5|1|0|6||6.6~8.5|0|4|2|6||>8.5|0|0|6|6||合計|5|5|8|18|χ2=18×(5×4×6+…)經公式得χ2≈16.2Cramér’sV=√[χ2/(n×min(r-1,c-1))]=√[16.2/(18×2)]≈0.672含義:續(xù)航與滿意度存在強關聯,V=0.672接近上限1。(5)設p=P(y≥80),初值β???=(-10,1)經一步Newton-Raphson:計算得分向量U與信息矩陣I,得β?1?=β???+I?1U≈(-11.24,1.35)即一步估計β?≈-11.24,β?≈1.35,表明續(xù)航每增加1小時,高滿意對數優(yōu)勢比增加1.35。——————————————————————4.某市氣象局研究PM2.5濃度x(μg/m3)與呼吸系統門診量y(人次)的關系,連續(xù)20天數據經計算得:x?=85,?=320,l??=2400,l??=18500,l??=4200回歸診斷發(fā)現第9天數據為異常點(x?=200,y?=650),Cook距離D?=1.38。(1)建立包含全部數據的回歸方程,并計算R2。(2)判斷D?=1.38是否達到刪除標準(臨界值F?.?,?,??≈3.55對應D>1視為強影響)。(3)剔除第9天后重新建立方程,并比較兩次回歸的斜率變化。(4)若將門診量分為“<300”“300~400”“>400”三檔,PM2.5分為“≤100”“101~150”“>150”三檔,構建3×3列聯表,計算χ2與列聯系數C,并檢驗獨立性(χ2?.??,?=9.488)。(5)基于剔除后的模型,求當x=160時,門診量95%預測區(qū)間(s=18.7,t?.???,17=2.110)?!敬鸢概c解析】(1)b?=4200/2400=1.75,a?=320-1.75×85=171.25?=171.25+1.75xSSR=b?l??=1.75×4200=7350R2=7350/18500≈0.397(2)D?=1.38>1,視為強影響點,建議剔除或采用穩(wěn)健回歸。(3)剔除后n=19,重新計算:l??'=2400-(200-85)2/20=2400-13225/20=1738.75l??'=4200-(200-85)(650-320)/20=4200-115×330/20=4200-1897.5=2302.5b?'=2302.5/1738.75≈1.324,斜率下降約24.4%,說明原斜率被異常點抬高。(4)3×3表(剔除后19天):|PM2.5\門診|<300|300~400|>400|合計||------------|----|--------|----|------||≤100|8|4|0|12||101~150|0|5|2|7||>150|0|0|2|2||合計|8|9|4|21|χ2≈13.86>9.488,拒絕獨立假設;C=√[χ2/(χ2+n)]=√[13.86/34.86]≈0.630,關聯較強。(5)x?=160,?=171.25+1.324×(160-85)=171.25+99.3=270.55√[1+1/19+(160-x?')2/l??'],x?'=(20×85-200)/19=80=√[1.0526+(80)2/1738.75]=√[1.0526+3.679]=√4.7316≈2.175半寬=2.110×18.7×2.175≈85.9區(qū)間:(270.55-85.9,270.55+85.9)=(184.6,356.5)——————————————————————5.綜合探究:某高校欲研究學生每日睡眠時間x(小時)與期末GPAy(4分制)的關系,隨機調查50名同學,得到:Σx=350,Σy=165,Σx2=2560,Σy2=562.5,Σxy=1185殘差正態(tài)性通過Shapiro-Wilk檢驗,但BP檢驗提示方差隨x增大而增大。(1)采用方差穩(wěn)定變換y*=√y,重新建立回歸模型,并比較R2。(2)對變換后模型進行加權最小二乘(權重w=1/x2),給出最終方程。(3)將GPA分為“<3.0”“3.0~3.5”“>3.5”三檔,睡眠分為“≤6”“6~8”“>8”三檔,構建3×3列聯表,計算χ2、Cramér’sV,并檢驗獨立性。(4)若定義“優(yōu)質睡眠”為x>7且“高GPA”為y>3.5,求相對風險RR與歸因比例AR(以睡眠≤7為暴露組)。(5)基于WLS模型,求x=7.5時GPA的95%置信區(qū)間(s=0.08,t?.???,48≈2.011)?!敬鸢概c解析】(1)y=√y,Σy=Σ√y=50×√3.3≈50×1.816=90.8l??=2560-50×72=2560-2450=110l??*=1185-50×7×1.816=1185-635.6=549.4b?*=549.4/110≈4.995a?*=1.816-4.995×7=-33.149?*=-33.149+4.995xR2=(b?l??)2/(l??l??),l??=Σy2-n?2=302.5-50×1.8162≈302.5-165.1=137.4R2≈(4.995×549.4)2/(110×137.4)≈0.912,高于原模型0.876,變換有效。(2)WLS:最小化Σw(y*-a-bx)2,w=1/x2正規(guī)方程:Σwy*=aΣw+bΣwxΣwxy*=aΣwx+bΣwx2解得:b?=WLSslope≈5.12,a?≈-34.0最終方程:?*=-34.0+5.12x(3)3×3表:|睡眠\GPA|<3.0|3.0~3.5|>3.5|合計||----------|----|--------|----|
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大秦醫(yī)院面試題及答案
- C語言基礎選擇測試題含多知識點考察及答案
- 感控護士院感防控知識試題及答案
- 新疆成人考試真題及答案
- 成都三基試題題庫附答案
- 市事業(yè)單位招聘考試公共基礎知識試題題庫附答案詳解
- 輸血三基考試試題及答案
- 三級醫(yī)院護士招聘面試題含答案
- 嵌入式開發(fā)面試題及答案
- 河南專升本試題及答案
- 起重設備安全使用指導方案
- 江蘇省揚州市區(qū)2025-2026學年五年級上學期數學期末試題一(有答案)
- 干部履歷表(中共中央組織部2015年制)
- GB/T 5657-2013離心泵技術條件(Ⅲ類)
- GB/T 3518-2008鱗片石墨
- GB/T 17622-2008帶電作業(yè)用絕緣手套
- GB/T 1041-2008塑料壓縮性能的測定
- 400份食物頻率調查問卷F表
- 滑坡地質災害治理施工
- 實驗動物從業(yè)人員上崗證考試題庫(含近年真題、典型題)
- 可口可樂-供應鏈管理
評論
0/150
提交評論