版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第二講成對數(shù)據(jù)的統(tǒng)計分析知識梳理·雙基自測知
識
梳
理知識點(diǎn)一變量的相關(guān)關(guān)系1.相關(guān)關(guān)系兩個變量有關(guān)系,但又沒有確切到可由其中的一個______________另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.2.散點(diǎn)圖每一個序號下的成對樣本數(shù)據(jù)都可用直角坐標(biāo)系中的______表示出來,由這些點(diǎn)組成的統(tǒng)計圖稱為散點(diǎn)圖.去精確地決定點(diǎn)3.正相關(guān)、負(fù)相關(guān)如果從整體上看,當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)________的趨勢,我們就稱這兩個變量正相關(guān);如果當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)________的趨勢,則稱這兩個變量負(fù)相關(guān).增加減小4.變量的線性相關(guān)如果兩個變量的取值呈現(xiàn)__________________,而且散點(diǎn)落在____________附近,我們就稱這兩個變量線性相關(guān).一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量_______________________.正相關(guān)或負(fù)相關(guān)一條直線相關(guān)或曲線相關(guān)非線性r∈[-1,1],當(dāng)r>0時,成對樣本數(shù)據(jù)__________;當(dāng)r<0時,成對樣本數(shù)據(jù)__________;當(dāng)|r|接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度________;當(dāng)|r|接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度________.正相關(guān)負(fù)相關(guān)越強(qiáng)越弱bx+a+e0σ2因變量或響應(yīng)變量自變量或解釋變量經(jīng)驗回歸直線最小二乘法最小二乘估計觀測值預(yù)測值殘差殘差分析小好大差知識點(diǎn)三獨(dú)立性檢驗1.分類變量:用以區(qū)別不同的現(xiàn)象或性質(zhì)的隨機(jī)變量.2.2×2列聯(lián)表設(shè)X,Y為兩個分類變量,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(2×2列聯(lián)表)如下:
y1y2總計x1ab________x2cdc+d總計a+c____________________________a+bb+da+b+c+d3.獨(dú)立性檢驗(1)零假設(shè)(或原假設(shè))以Ω為樣本空間的古典概型.設(shè)X和Y為定義在Ω上,取值于{0,1}的成對分類變量.H0:________________________________稱為零假設(shè).P(Y=1|X=0)=P(Y=1|X=1)(2)臨界值χ2=_______________________.對于任何小概率值α,可以找到相應(yīng)的正實數(shù)xα,使得下面關(guān)系成立:P(
2≥xα)=α.稱xα為α的__________,這個臨界值就可作為判斷χ2大小的標(biāo)準(zhǔn).概率值α越小,臨界值xα越大.臨界值(3)獨(dú)立性檢驗基于小概率值α的檢驗規(guī)則是:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y__________,該推斷犯錯誤的概率不________;當(dāng)χ2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y________.這種利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為
2獨(dú)立性檢驗,讀作“卡方獨(dú)立性檢驗”,簡稱獨(dú)立性檢驗.不獨(dú)立超過α獨(dú)立4.獨(dú)立性檢驗解決實際問題的一般步驟(1)提出零假設(shè)H0:X與Y相互獨(dú)立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2值,并與臨界值xα比較.(3)根據(jù)經(jīng)驗規(guī)則得出推斷結(jié)論.(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.歸
納
拓
展1.回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的方法,只有在散點(diǎn)圖大致呈線性分布時,求出的經(jīng)驗回歸方程才有實際意義,否則,求出的經(jīng)驗回歸方程毫無意義.根據(jù)經(jīng)驗回歸方程進(jìn)行預(yù)報,僅是一個預(yù)報值,而不是真實發(fā)生的值.雙
基
自
測題組一走出誤區(qū)1.判斷下列結(jié)論是否正確(請在括號中打“√”或“×”)(1)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)系.(
)(2)兩個隨機(jī)變量的線性相關(guān)性越強(qiáng),相關(guān)系數(shù)的絕對值越接近于0.(
)(3)只有兩個變量有相關(guān)關(guān)系,所得到的回歸模型才有預(yù)測價值.(
)√√×√××BD3.(選擇性必修3P132例3)某兒童醫(yī)院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機(jī)抽樣的方法對治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名、治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨(dú)立性檢驗,分析甲、乙兩種療法的效果,結(jié)論為________________________.附:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828兩種療法效果沒有差異
[解析]
由題意的兩種療法數(shù)據(jù)的列聯(lián)表療法療效合計未治愈治愈甲155267乙66369合計21115136題組三走向高考4.(2023·高考天津卷)調(diào)查某種群花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示,其中相關(guān)系數(shù)r=0.8245,下列說法正確的是(
)A.花瓣長度和花萼長度沒有相關(guān)性B.花瓣長度和花萼長度呈現(xiàn)負(fù)相關(guān)C.花瓣長度和花萼長度呈現(xiàn)正相關(guān)D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8245C[解析]
根據(jù)散點(diǎn)的集中程度可知,花瓣長度和花萼長度有相關(guān)性,A選項錯誤;散點(diǎn)的分布是從左下到右上,從而花瓣長度和花萼長度呈現(xiàn)正相關(guān)性,B選項錯誤,C選項正確;由于r=0.8245是全部數(shù)據(jù)的相關(guān)系數(shù),取出來一部分?jǐn)?shù)據(jù),相關(guān)性可能變強(qiáng),可能變?nèi)?,即取出的?shù)據(jù)的相關(guān)系數(shù)不一定是0.8245,D選項錯誤.故選C.5.(2022·全國高考甲卷(節(jié)選))甲、乙兩城之間的長途客車均由A和B兩家公司運(yùn)營,為了解這兩家公司長途客車的運(yùn)行情況,隨機(jī)調(diào)查了甲、乙兩城之間的500個班次,得到下面列聯(lián)表:能否有90%的把握認(rèn)為甲、乙兩城之間的長途客車是否準(zhǔn)點(diǎn)與客車所屬公司有關(guān)?
準(zhǔn)點(diǎn)班次數(shù)未準(zhǔn)點(diǎn)班次數(shù)A24020B21030P(χ2≥xα)0.1000.0500.010xα2.7063.8416.635[解析]
根據(jù)已知數(shù)據(jù)得到列聯(lián)表如下:公司準(zhǔn)點(diǎn)班次數(shù)未準(zhǔn)點(diǎn)班次數(shù)合計A24020260B21030240合計45050500考點(diǎn)突破·互動探究相關(guān)關(guān)系的判斷——自主練透1.(2024·湖南名校聯(lián)考聯(lián)合體聯(lián)考)某校數(shù)學(xué)興趣小組在某座山測得海拔高度x(單位:千米)與氣壓y(單位:千帕)的六組數(shù)據(jù)(xi,yi)(i=1,2,…,6)繪制成如下散點(diǎn)圖,分析研究發(fā)現(xiàn)B點(diǎn)相關(guān)數(shù)據(jù)不符合實際,刪除B點(diǎn)后重新進(jìn)行回歸分析,則下列說法正確的是(
)A.刪除點(diǎn)B后,樣本數(shù)據(jù)的兩變量x,y正相關(guān)B.刪除點(diǎn)B后,相關(guān)系數(shù)r的絕對值更接近于1C.刪除點(diǎn)B后,新樣本的殘差平方和變大D.刪除點(diǎn)B后,解釋變量x與響應(yīng)變量y相關(guān)性變?nèi)魾[解析]
從散點(diǎn)圖中可知,刪除點(diǎn)B后,樣本數(shù)據(jù)的兩變量x,y負(fù)相關(guān),所以A錯誤;由于B點(diǎn)較其他點(diǎn)偏離程度大,故去掉B點(diǎn)后,回歸效果更好,從而相關(guān)系數(shù)r的絕對值更接近于1,所以B正確;同理決定系數(shù)R2越接近于1,所以新樣本的殘差平方和變小,所以C錯誤;從而解釋變量x與響應(yīng)變量y相關(guān)性增強(qiáng),所以D錯誤.故選B.2.(多選題)(2023·河北邯鄲期末)對兩組數(shù)據(jù)進(jìn)行統(tǒng)計后得到的散點(diǎn)圖如圖,關(guān)于其線性相關(guān)系數(shù)的結(jié)論正確的是()A.r1<0 B.r2>1C.r1+r2>0 D.|r1|>|r2|AC[解析]
由散點(diǎn)圖可知,線性相關(guān)系數(shù)r1的圖象表示y與x成負(fù)相關(guān),故-1<r1<0,故A正確;線性相關(guān)系數(shù)r2的圖象表示y與x正相關(guān),故1>r2>0,故B錯誤;∵線性相關(guān)系數(shù)r2的點(diǎn)較線性相關(guān)系數(shù)r1的點(diǎn)密集,故|r2|>|r1|,故r1+r2>0,故C正確,D錯誤.故選AC.【變式訓(xùn)練】(2023·高考上海卷)根據(jù)所示的散點(diǎn)圖,下列說法正確的是(
)A.身高越大,體重越大B.身高越大,體重越小C.身高和體重成正相關(guān)D.身高和體重成負(fù)相關(guān)[解析]
根據(jù)散點(diǎn)圖的分布可得:身高和體重成正相關(guān).故選C.C回歸分析——多維探究角度1一元線性回歸模型1.(2024·河北邢臺名校聯(lián)盟期中)某商店的某款商品近5個月的月銷售量y(單位:千瓶)如下表:第x個月12345月銷售量y2.53.244.85.5AB2.(2023·河南安陽開學(xué)考)2022年6月某一周,“東方甄選”直播間的交易額共計3.5億元,數(shù)據(jù)統(tǒng)計如下表:(1)通過分析,發(fā)現(xiàn)可用線性回歸模型擬合交易額y與t的關(guān)系,請用相關(guān)系數(shù)(系數(shù)精確到0.01)加以說明;第t天1234567交易額y/千萬元y1y2y3y4y5y6y7因為交易額y與t的相關(guān)系數(shù)近似為0.98,說明交易額y與t具有很強(qiáng)的正線性相關(guān)關(guān)系,從而可用線性回歸模型擬合交易額y與t的關(guān)系.BC2.(2024·山東濟(jì)南摸底)隨著科技的發(fā)展,網(wǎng)購成了人們購物的重要選擇,并對實體經(jīng)濟(jì)產(chǎn)生了一定影響.為了解實體經(jīng)濟(jì)的現(xiàn)狀,某研究機(jī)構(gòu)統(tǒng)計了一個大商場2018—2022年的線下銷售額如下:年份編號x12345年份20182019202020212022銷售額y(單位:萬元)1513146512021060860角度2一元非線性回歸模型(2024·重慶七校開學(xué)考試)中國茶文化博大精深,飲茶深受大眾喜愛.茶水的口感與茶葉類型和水的溫度有關(guān).某數(shù)學(xué)建模小組為了獲得茶水溫度y
℃關(guān)于時間x(min)的回歸方程模型,通過實驗做初步處理得到如圖所示散點(diǎn)圖.(1)根據(jù)散點(diǎn)圖判斷,①y=a+bx與②y=d·cx+25哪一個更適宜作為該茶水溫度y關(guān)于時間x的回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立該茶水溫度y關(guān)于時間x的回歸方程;(3)已知該茶水溫度降至60℃口感最佳.根據(jù)(2)中的回歸方程,求在相同條件下沖泡的茶水,大約需要放置多長時間才能達(dá)到最佳飲用口感?0.29獨(dú)立性檢驗——師生共研1.(多選題)(2024·重慶質(zhì)檢)千百年來,我國勞動人民在生產(chǎn)實踐中根據(jù)云的形狀、走向、速度、厚度、顏色等的變化,總結(jié)了豐富的“看云識天氣”的經(jīng)驗,并將這些經(jīng)驗編成諺語,如“天上鉤鉤云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同學(xué)為了驗證“日落云里走,雨在半夜后”,觀察了A地區(qū)的100天日落和夜晚天氣,得到如下2×2列聯(lián)表,并計算得到χ2≈19.05,下列小波對A地區(qū)天氣的判斷正確的是()日落云里走夜晚天氣下雨未下雨出現(xiàn)255未出現(xiàn)2545ABC2.(2024·河北秦皇島部分學(xué)校檢測)某市電視臺為了解一檔節(jié)目收視情況,隨機(jī)抽取了該市n對夫妻進(jìn)行調(diào)查,根據(jù)調(diào)查得到每人日均收看該節(jié)目的時間繪制成如圖所示的頻率分布直方圖,收視時間不低于40分鐘的觀眾稱為“熱心觀眾”,收視時間低于40分鐘的觀眾稱為“非熱心觀眾”,已知抽取樣本中收視時間低于10分鐘的有10人.(1)求n,p;(2)根據(jù)已知條件完成下面2×2列聯(lián)表,試根據(jù)小概率值α=0.05的獨(dú)立性檢驗,分析“熱心觀眾”是否與性別有關(guān).
非熱心觀眾熱心觀眾總計男
女
10
總計
(2)∵n=50,∴“熱心觀眾”有2×50×(0.020+0.005)×10=25人,則2×2列聯(lián)表如下所示:
非熱心觀眾熱心觀眾總計男351550女401050總計7525100名師點(diǎn)撥:解獨(dú)立性檢驗的應(yīng)用問題的關(guān)注點(diǎn)1.兩個明確:(1)明確兩類主體.(2)明確研究的兩個問題.2.兩個關(guān)鍵:(2)準(zhǔn)確列出2×2列聯(lián)表.(2)準(zhǔn)確理解χ2.注意:查表時不是查最大允許值,而是先根據(jù)題目要求的百分比找到第一行對應(yīng)的數(shù)值,再將該數(shù)值對應(yīng)的xα值與求得的
2相比較.另外,表中第一行數(shù)據(jù)表示兩個變量沒有關(guān)聯(lián)的可能性p,所以其有關(guān)聯(lián)的可能性為1-p.【變式訓(xùn)練】(2024·湖北武漢部分學(xué)校調(diào)研)近期世界地震、洪水、森林大火等自然災(zāi)害頻繁出現(xiàn),緊急避險知識越來越引起人們的重視.某校為考察學(xué)生對緊急避險知識的掌握情況,從全校學(xué)生中選取200名學(xué)生進(jìn)行緊急避險知識測試,其中男生110名,女生90名.所有學(xué)生的測試成績都在區(qū)間[50,100]范圍內(nèi),由測試成績數(shù)據(jù)作出如圖所示的頻率分布直方圖.(1)若從頻率分布直方圖中估計出樣本的平均數(shù)與中位數(shù)相等,求圖中m的值;(2)規(guī)定測試成績不低于80分為優(yōu)秀,已知共有45名男生成績優(yōu)秀,完成下面的列聯(lián)表,并根據(jù)小概率值α=0.05的獨(dú)立性檢驗,能否推斷男生和女生的測試成績優(yōu)秀率有差異?性別測試成績合計優(yōu)秀不優(yōu)秀男生45
女生
合計
α0.10.050.01xα2.7063.8416.635(2)總的成績優(yōu)秀人數(shù)為:200×10×(0.025+0.01)=70,得到列聯(lián)表為:性別測試成績合計優(yōu)秀不優(yōu)秀男生4565110女生256590合計70130200名師講壇·素養(yǎng)提升重溫高考1.(2021·全國高考乙卷)某廠研制了一種生產(chǎn)高精產(chǎn)品的設(shè)備,為檢驗新設(shè)備生產(chǎn)產(chǎn)品的某項指標(biāo)有無提高,用一臺舊設(shè)備和一臺新設(shè)備各生產(chǎn)了10件產(chǎn)品,得到各件產(chǎn)品該項指標(biāo)數(shù)據(jù)如下:舊設(shè)備9.810.310.010.29.99.810.010.110.29.7新設(shè)備10.110.410.110.010.110.310.610.510.410.52.(2021·全國高考)甲、乙兩臺機(jī)床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質(zhì)量分為一級品和二級品,為了比較兩臺機(jī)床產(chǎn)品的質(zhì)量,分別用兩臺機(jī)床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質(zhì)量情況統(tǒng)計如下表:
一級品二級品合計甲機(jī)床15050200乙機(jī)床12080200合計270130400(1)甲機(jī)床、乙機(jī)床生產(chǎn)的產(chǎn)品中一級品的頻率分別是多少?(2)能否有99%的把握認(rèn)為甲機(jī)床的產(chǎn)品質(zhì)量與乙機(jī)床的產(chǎn)品質(zhì)量有差異?P(
2≥xα)0.0500.0100.001xα3.8416.63510.828【變式訓(xùn)練】1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年珠海市公安局金灣分局等單位公開招聘公安輔警16人備考題庫有答案詳解
- 佛山市順德區(qū)陳村鎮(zhèn)吳維泰紀(jì)念小學(xué)面向2026屆畢業(yè)生赴高校設(shè)點(diǎn)公開招聘教師備考題庫及完整答案詳解一套
- 2025至2030中國氫能重卡示范運(yùn)營效果與基礎(chǔ)設(shè)施配套報告
- 2026年長江水利委員會南水北調(diào)中線水源有限責(zé)任公司招聘備考題庫完整答案詳解
- 中國國際貨運(yùn)航空股份有限公司備考題庫技術(shù)工程師崗位2026屆高校畢業(yè)生校園招聘備考題庫及答案詳解一套
- 中國黃金集團(tuán)廣西有限公司2026年度招聘備考題庫(第一批)參考答案詳解
- 2026年許昌市魏都區(qū)北大社區(qū)衛(wèi)生服務(wù)中心招聘備考題庫及參考答案詳解
- 2025-2030鋁合金電纜市場投資前景分析及供需格局研究研究報告
- 2026年肇慶市第十二中學(xué)招聘備考題庫完整答案詳解
- 中銀國際證券股份有限公司2025年社會招聘備考題庫帶答案詳解
- 開題報告范文基于人工智能的醫(yī)學(xué)像分析與診斷系統(tǒng)設(shè)計
- 大黃附子細(xì)辛湯課件
- 《人間充質(zhì)基質(zhì)細(xì)胞來源細(xì)胞外囊泡凍干粉質(zhì)量要求》(征求意見稿)
- 中潤盛和(孝義)新能源科技 孝義市杜村鄉(xiāng)分散式微風(fēng)發(fā)電項目可行性研究報告
- 入團(tuán)申請書教學(xué)課件
- 2026年中國農(nóng)業(yè)銀行秋季校園招聘即將開始考試筆試試題(含答案)
- 2025年江蘇省招聘警務(wù)輔助人員考試真題及答案
- 山東濟(jì)南2019-2024年中考滿分作文87篇
- (2025年標(biāo)準(zhǔn))sm調(diào)教協(xié)議書
- 醫(yī)院急救應(yīng)急體系構(gòu)建與實施
- TCES 109-2022 舌診儀 第一部分:一般要求
評論
0/150
提交評論