版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三節(jié)成對數據的統(tǒng)計分析第九章統(tǒng)計與統(tǒng)計案例考試要求:掌握散點圖、最小二乘法思想、回歸分析以及獨立性檢驗.必備知識·回顧教材重“四基”01一、教材概念·結論·性質重現1.相關關系兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為_________.2.散點圖將各數據在平面直角坐標系中的對應點畫出來,得到表示兩個變量的一組數據的圖形,這樣的統(tǒng)計圖叫做_______.利用散點圖,可以判斷兩個變量是否相關,相關時是正相關還是負相關.相關關系散點圖3.正相關和負相關(1)正相關:如果從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現增加的趨勢,我們就稱這兩個變量_______.(2)負相關:如果當一個變量的值增加時,另一個變量的相應值呈現減少的趨勢,則稱這兩個變量_______.正相關負相關相關關系與函數關系的區(qū)別與聯系(1)相同點:兩者均是指兩個變量的關系.(2)不同點:①函數關系是一種確定的關系,相關關系是一種非確定的關系.②函數關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.4.線性相關和非線性相關(1)一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條_____附近,我們就稱這兩個變量_________.(2)一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量_______相關或曲線相關.5.樣本相關系數r變量x和變量y的樣本相關系數r的計算公式如下:r=直線線性相關非線性(1)當r>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關;當r=0時,稱成對樣本數據間沒有線性相關關系.(2)樣本相關系數r的取值范圍為[-1,1];當|r|越接近1時,成對樣本數據的線性相關程度越強;當|r|越接近0時,成對樣本數據的線性相關程度越弱.
(2)基于概率值α的檢驗規(guī)則:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.
34512√√××2.(多選題)關于回歸分析,下列說法正確的是(
)A.在回歸分析中,變量間的關系若是非確定性關系,那么因變量不能由自變量唯一確定B.線性相關系數可以是正的也可以是負的C.在回歸分析中,如果r2=1或r=±1,說明x與y之間完全線性相關D.樣本相關系數r∈(-1,1)ABC
解析:選項D中,樣本的相關系數應滿足-1≤r≤1,故D錯誤,ABC都正確.345123.以下四幅散點圖所對應的樣本相關系數的大小關系是(
)3451234512A.r1>r2>r3>r4 B.r4>r3>r2>r1C.r1>r3>r4>r2 D.r1>r2>r4>r334512C
解析:由散點圖的特征可知,(1)(3)為正相關,(2)(4)為負相關,所以r1>0,r3>0,r2<0,r4<0.又(1)(2)中的散點更為集中,更接近于一條直線,故r1>r3,r2<r4,所以r2<r4<0<r3<r1.4.高二第二學期期中考試,按照甲、乙兩個班學生的數學成績優(yōu)秀和及格統(tǒng)計人數后,得到如下列聯表:34512
優(yōu)秀及格合計甲班113445乙班83745合計197190
34512關鍵能力·研析考點強“四翼”考點1相關關系的判斷——基礎性02考點2一元線性回歸模型及其應用——基礎性考點3殘差分析——應用性考點4列聯表與獨立性檢驗——綜合性1.有以下五組變量:①某商品的銷售價格與銷售量;②學生的學籍號與學生的數學成績;③堅持每天吃早餐的人數與患胃病的人數;④氣溫與冷飲銷售量;⑤電瓶車的重量和行駛每千米的耗電量.其中兩個變量成正相關的是(
)A.①③ B.②④C.②⑤
D.④⑤考點1相關關系的判斷——基礎性D
解析:對于①,一般情況下,某商品的銷售價格與銷售量成負相關關系;對于②,學生的學籍號與學生的數學成績沒有相關關系;對于③,一般情況下,堅持每天吃早餐的人數與患胃病的人數成負相關關系;對于④,一般情況下,氣溫與冷飲銷售量成正相關關系;對于⑤,一般情況下,電瓶車的重量和行駛每千米的耗電量成正相關關系.綜上所述,其中兩個變量成正相關的序號是④⑤.2.兩個變量的相關關系有①正相關、②負相關、③不相關,則下列散點圖從左到右分別反映的變量間的相關關系是(
)A.①②③ B.②③①C.②①③ D.①③②D
解析:對于(1),圖中的點成帶狀分布,且從左到右上升,是正相關關系;對于(2),圖中的點沒有明顯的帶狀分布,是不相關的;對于(3),圖中的點成帶狀分布,且從左到右是下降的,是負相關關系.忽視散點圖的結構特點導致錯誤(1)兩個變量具有正相關關系時,其散點圖是從左下方到右上方的直線附近;(2)兩個變量具有負相關關系時,其散點圖是左上方到右下方的直線附近.考向1線性回歸分析例1
維尼綸纖維的耐熱水性能的好壞可以用指標“縮醛化度”y來衡量,這個指標越高,耐熱水性能也越好.而甲醛濃度是影響縮醛化度y(克分子%)的重要因素,在生產中常用甲醛濃度x(g/L)去控制這一指標,為此必須找出它們之間的關系.現安排一批實驗,獲得如下數據:考點2一元線性回歸模型及其應用——基礎性甲醛濃度x(g/L)18202224262830縮醛化度y(克分子%)26.8628.3528.7528.8729.7530.0030.36(1)畫散點圖,并判斷成對樣本數據是否線性相關;解:畫出散點圖如圖所示.由散點圖可以看出,成對數據呈現出相關關系.(2)求樣本相關系數r(精確到0.01),并通過樣本相關系數判斷甲醛濃度與縮醛化度的相關程度和變化趨勢的異同.
=4900.16,
=4144,
解這類問題先畫出散點圖,利用散點圖觀察兩個變量之間的關系,若兩個變量具有相關關系,再利用樣本相關系數r進行進一步的判斷.考向2非線性回歸分析例2
紅鈴蟲是棉花的主要害蟲之一,其產卵數與溫度有關.現收集到一只紅鈴蟲的產卵數y(個)和溫度x(℃)的8組觀測數據,制成圖1所示的散點圖.現用兩種模型①y=a·bx(a>0,b>0),②y=cx2+d分別進行擬合,由此得到相應的非線性回歸方程并進行殘差分析,進一步得到圖2所示的殘差圖.根據收集到的數據,計算得到如下值:252.8964616842268848.4870308
(1)根據殘差圖,比較模型①,②的擬合效果,應選擇哪個模型?請說明理由.解:應該選擇模型①.理由:模型①殘差點比較均勻地落在水平的帶狀區(qū)域中,且?guī)顓^(qū)域的寬度比模型②帶狀寬度窄,所以模型①的擬合精度更高,回歸方程的預報精度相應就會越高.故選模型①比較合適.(2)根據(1)中所選擇的模型,求出y關于x的非線性經驗回歸方程(計算過程中四舍五入保留兩位小數),并求溫度為35℃時,產卵數y的預報值.參考數據:e5.61≈273,e5.70≈299,e5.79≈327.
非線性回歸分析的解題步驟某種昆蟲的日產卵數和時間變化有關,現收集了該昆蟲第1天到第5天的日產卵數據:第x天12345日產卵數y(個)612254995對數據初步處理后得到了如圖所示的散點圖和表中的統(tǒng)計量的值.(1)根據散點圖,利用計算機模擬出該種昆蟲日產卵數y關于x的經驗回歸方程為y=ea+bx(其中e為自然對數的底數),求實數a,b的值(精確到0.1).155515.9454.75
(2)根據某項指標測定,若日產卵數在區(qū)間(e6,e8)上的時段為優(yōu)質產卵期.利用(1)的結論,估計在第6天到第10天中任取2天,其中恰有1天為優(yōu)質產卵期的概率.
例3
近年來,中國電影市場蓬勃發(fā)展,連創(chuàng)票房奇跡,各地陸續(xù)新增了許多影院.某市新開業(yè)的一家影院借助舒適的環(huán)境和較好的觀影體驗吸引越來越多的人前來觀影,該影院的相關負責人統(tǒng)計了剛開業(yè)7天內每一天前來觀影的人次,用x表示影院開業(yè)的天數,y表示每天前來觀影的人次.考點3殘差分析——應用性(1)該影院的相關負責人分別用兩種模型①y=a+bx,②y=c·dx(c,d為大于零的常數)進行擬合,得到相應的經驗回歸方程并進行殘差分析,得到如圖所示的殘差圖.根據殘差圖,比較模型①、②的擬合效果,應選擇哪個模型?(給出判斷即可,不必說明理由)解:應該選擇模型①.(2)根據(1)的判斷結果求y關于x的經驗回歸方程,并預測該影院開業(yè)第8天前來觀影的人次.參考數據:41354704140
利用R2刻畫回歸效果:R2=1-
R2越大,模型擬合效果越好,R2越小,模型擬合效果越差.新型冠狀病毒感染疫情發(fā)生以來,在世界各地逐漸蔓延.在全國人民的共同努力和各級部門的嚴格管控下,我國的疫情已經得到了很好的控制.然而,小王同學發(fā)現,每個國家在疫情發(fā)生的初期,由于認識不足和措施不到位,感染人數都會出現快速的增長.如表是小王同學記錄的某國連續(xù)8天每日新型冠狀病毒感染確診的累計人數.日期代碼x12345678累計確診人數y481631517197122
經過計算得:
=42,
(1)根據殘差圖,比較模型①、②的擬合效果,應該選擇哪個模型?請簡要說明理由.解:選擇模型①,理由如下:根據殘差圖可以看出,模型①的估計值和真實值相對比較接近,模型②的殘差相對比較大,所以模型①的擬合效果相對較好.(2)根據(1)問選定的模型求出相應的經驗回歸方程(系數均保留兩位小數).
(3)由于時差,該國截至第9天新型冠狀病毒感染確診的累計人數尚未公布.小王同學認為,如果防疫形勢沒有得到明顯改善,在數據公布之前可以根據他在第(2)問求出的經驗回歸方程來對感染人數做出預測,那么估計該地區(qū)第9天新型冠狀病毒感染確診的累計人數是多少?
例4
某省進行高中新課程改革已經四年了,為了解教師對新課程教學模式的使用情況,某一教育機構對某學校的教師關于新課程教學模式的使用情況進行了問卷調查.共調查了50人,其中有老教師20人,青年教師30人.老教師對新課程教學模式贊同的有10人,不贊同的有10人;青年教師對新課程教學模式贊同的有24人,不贊同的有6人.(1)根據以上數據建立一個2×2列聯表.考點4列聯表與獨立性檢驗——綜合性解:2×2列聯表如下所示.類別贊同不贊同合計老教師101020青年教師24630合計341650
(2022·鄭州期末)某電視臺在周末晚間推出一檔新的綜藝節(jié)目,為了了解節(jié)目效果,一次節(jié)目結束后,隨機抽取了500名觀眾(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 金礦安全培訓題庫及答案
- 辦公空間租賃合同2025年使用權約定
- 聲音信號處理芯片
- 2025年河北省公需課學習-環(huán)境影響評價制度改革專題22
- 2025年晉城高二試卷物理及答案
- 沙漠性格測試題目及答案
- 上海稅務考研真題及答案
- 湘潭輔警筆試題庫及答案
- 機械操作服務合同范本
- 赤峰生物中考真題及答案
- 心衰患者的康復護理
- 2026年內科護理工作計劃范文4篇
- 2025年搜索廣告(初級)營銷師-巨量認證考試題(附答案)
- 2025超重和肥胖管理指南課件
- 武警拓展訓練方案
- 化肥產品生產許可證實施細則(一)(復肥產品部分)2025
- 初中be動詞的使用
- 婦產科考試試題及答案
- 光伏電站運維人員培訓與技能提升方案
- 安全文明施工資料管理方案
- GB/T 46194-2025道路車輛信息安全工程
評論
0/150
提交評論