2026高考數(shù)學(xué)一輪復(fù)習(xí)第53講 成對數(shù)據(jù)的統(tǒng)計(jì)分析 【正文】聽課 學(xué)生用_第1頁
2026高考數(shù)學(xué)一輪復(fù)習(xí)第53講 成對數(shù)據(jù)的統(tǒng)計(jì)分析 【正文】聽課 學(xué)生用_第2頁
2026高考數(shù)學(xué)一輪復(fù)習(xí)第53講 成對數(shù)據(jù)的統(tǒng)計(jì)分析 【正文】聽課 學(xué)生用_第3頁
2026高考數(shù)學(xué)一輪復(fù)習(xí)第53講 成對數(shù)據(jù)的統(tǒng)計(jì)分析 【正文】聽課 學(xué)生用_第4頁
2026高考數(shù)學(xué)一輪復(fù)習(xí)第53講 成對數(shù)據(jù)的統(tǒng)計(jì)分析 【正文】聽課 學(xué)生用_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

《全品高考復(fù)習(xí)方案》第53講成對數(shù)據(jù)的統(tǒng)計(jì)分析【課標(biāo)要求】1.了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義,了解樣本相關(guān)系數(shù)與標(biāo)準(zhǔn)化數(shù)據(jù)向量夾角的關(guān)系,會通過樣本相關(guān)系數(shù)比較多組成對數(shù)據(jù)的相關(guān)程度.

2.了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義,了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計(jì)方法,會用一元線性回歸模型進(jìn)行預(yù)測.

3.理解2×2列聯(lián)表的統(tǒng)計(jì)意義,了解2×2列聯(lián)表獨(dú)立性檢驗(yàn)及其應(yīng)用.一、經(jīng)驗(yàn)回歸分析1.兩個變量相關(guān)性的判斷(1)相關(guān)關(guān)系:兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.(2)正相關(guān)與負(fù)相關(guān)從整體上看,當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)的趨勢,則稱這兩個變量正相關(guān);當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)的趨勢,則稱這兩個變量負(fù)相關(guān).

(3)線性相關(guān)關(guān)系:兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在附近,則稱這兩個變量線性相關(guān).

(4)樣本相關(guān)系數(shù)(i)計(jì)算:r=(ii)樣本相關(guān)系數(shù)r的性質(zhì)①當(dāng)r>0時,表明成對樣本數(shù)據(jù);當(dāng)r<0時,表明成對樣本數(shù)據(jù).

②當(dāng)|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越;當(dāng)|r|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越.

2.一元線性回歸模型(1)線性經(jīng)驗(yàn)回歸方程:利用最小二乘法求得y=bx+a,其中b(2)評價回歸模型的優(yōu)劣:(i)利用殘差平方和:∑i=1n(yi(ii)利用殘差圖:殘差點(diǎn)分布在以為對稱軸的帶狀區(qū)域內(nèi),該區(qū)域越,擬合效果越好.

(iii)利用決定系數(shù):R2=1-∑i=1二、獨(dú)立性檢驗(yàn)1.分類變量X,Y的2×2列聯(lián)表XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d記n=a+b+c+d,則隨機(jī)變量χ2=n(ad-bc2.獨(dú)立性檢驗(yàn)(1)定義:利用隨機(jī)變量的取值推斷兩個分類變量X和Y是否的方法稱為獨(dú)立性檢驗(yàn).

(2)獨(dú)立性檢驗(yàn)的基本步驟①提出零假設(shè)H0:分類變量X和Y相互獨(dú)立;②列出分類變量X和Y的抽樣數(shù)據(jù)列聯(lián)表;③利用公式計(jì)算隨機(jī)變量χ2的值;④把計(jì)算得到的χ2的值與小概率值α相應(yīng)的臨界值表中的臨界值xα比較.當(dāng)χ2≥xα?xí)r,就推斷H0不成立,即認(rèn)為X與Y不獨(dú)立,此推斷犯錯誤的概率不超過α;當(dāng)χ2<xα?xí)r,沒有充分證據(jù)推斷H0不成立,可以認(rèn)為H0成立,即認(rèn)為X與Y獨(dú)立.題組一易錯辨析判斷下列說法是否正確.(請?jiān)诶ㄌ栔写颉啊獭被颉啊痢?(1)只有兩個變量有相關(guān)關(guān)系,所得到的回歸模型才有預(yù)測價值. ()(2)獨(dú)立性檢驗(yàn)的本質(zhì)是比較觀測值與期望值之間的差異. ()(3)獨(dú)立性檢驗(yàn)與簡單比較兩個頻率得到的結(jié)果是一致的. ()(4)由變量x,y的樣本數(shù)據(jù)點(diǎn)集合{(xi,yi)|i=1,2,…,n},求得的經(jīng)驗(yàn)回歸方程為y=1.5x+0.5,且x=3,現(xiàn)發(fā)現(xiàn)兩個數(shù)據(jù)點(diǎn)(1.3,2.1)和(4.7,7.9)誤差較大,去除后重新求得的經(jīng)驗(yàn)回歸直線l的斜率為1.2,則去除數(shù)據(jù)點(diǎn)后的經(jīng)驗(yàn)回歸方程為y=1.2x+1.6. ()題組二教材改編1.在研究吸煙是否對患肺癌有影響的案例中,通過對列聯(lián)表的數(shù)據(jù)進(jìn)行處理,計(jì)算得到隨機(jī)變量χ2≈56.632,則下面說法正確的是 ()α0.010.0050.001xα6.6357.87910.828A.因?yàn)殡S機(jī)變量χ2>10.828,所以依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),認(rèn)為“吸煙與患肺癌有關(guān)聯(lián)”,并且這個結(jié)論犯錯誤的概率不超過0.001B.因?yàn)殡S機(jī)變量χ2>10.828,所以依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),認(rèn)為“吸煙與患肺癌有關(guān)聯(lián)”,并且這個結(jié)論犯錯誤的概率不低于0.001C.因?yàn)殡S機(jī)變量χ2>10.828,所以依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),認(rèn)為“吸煙與患肺癌沒有關(guān)聯(lián)”,并且這個結(jié)論犯錯誤的概率不超過0.001D.因?yàn)殡S機(jī)變量χ2>10.828,所以依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),認(rèn)為“吸煙與患肺癌沒有關(guān)聯(lián)”,并且這個結(jié)論犯錯誤的概率不低于0.0012.以下是標(biāo)號分別為①②③④的四幅散點(diǎn)圖,它們的樣本相關(guān)系數(shù)分別為r1,r2,r3,r4,那么樣本相關(guān)系數(shù)的大小關(guān)系為(按由小到大的順序排列).

3.某食品研究部門為了解一種酒品的儲藏年份與芳香度之間的相關(guān)關(guān)系,在市場上收集到了一部分不同儲藏年份的該酒品,并測定了其芳香度(如下表).儲藏年份x014568芳香度y1.31.85.67.49.3由最小二乘法得到經(jīng)驗(yàn)回歸方程y=1.03x+1.13,但不小心在檢測后滴到表格上一滴檢測液,污損了一個數(shù)據(jù),則推斷該數(shù)據(jù)為.

成對數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性例1(1)(多選題)下列有關(guān)樣本相關(guān)系數(shù)r的說法正確的是 ()A.r的取值范圍是[-1,1]B.r的取值范圍是[0,1]C.|r|越接近1,表示成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng)D.|r|越接近0,表示成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng)(2)[2024·山東棗莊期末]具有相關(guān)關(guān)系的變量x,y的散點(diǎn)圖如圖所示,若剔除點(diǎn)A,則剩下的數(shù)據(jù)較剔除之前值變大的是 ()A.y的樣本平均數(shù)B.樣本相關(guān)系數(shù)C.對應(yīng)經(jīng)驗(yàn)回歸方程的決定系數(shù)R2D.對應(yīng)經(jīng)驗(yàn)回歸方程的殘差的平方和總結(jié)反思對兩個變量的相關(guān)關(guān)系的判斷有兩種常用方法:1.根據(jù)散點(diǎn)圖進(jìn)行判斷,這種方法具有很強(qiáng)的直觀性,能夠直接得出兩個變量是正相關(guān)還是負(fù)相關(guān),擬合效果的好壞也可由散點(diǎn)圖直接判斷.2.計(jì)算樣本相關(guān)系數(shù),樣本相關(guān)系數(shù)能比較準(zhǔn)確地反映兩個變量的相關(guān)程度,樣本相關(guān)系數(shù)的絕對值越接近1,兩個變量的相關(guān)程度就越強(qiáng).【對點(diǎn)演練1】(1)[2024·福建福州模擬]在以下4幅散點(diǎn)圖中,y和x具有正線性相關(guān)關(guān)系的是 ()A BC D(2)(多選題)下列說法中,正確的是 ()A.若兩個變量x與y的樣本相關(guān)系數(shù)r<0,則這兩個變量負(fù)相關(guān)B.若兩個變量x與y的樣本相關(guān)系數(shù)r越大,則這兩個變量的線性相關(guān)程度越強(qiáng)C.若兩個變量x與y的樣本相關(guān)系數(shù)r=0,則這兩個變量不具有相關(guān)關(guān)系D.對于兩個變量x與y的經(jīng)驗(yàn)回歸方程,若決定系數(shù)R2越大,則經(jīng)驗(yàn)回歸方程的擬合效果越好一元回歸模型題型1線性回歸模型例2(1)[2024·吉林長春期末]對于數(shù)據(jù)組(xi,yi)(i=1,2,…,n),如果由經(jīng)驗(yàn)回歸方程得到的yi的估計(jì)值是yi,那么將yi-yi所得的差稱為樣本點(diǎn)(xi,yi)處的殘差.某商場為了給一種新商品進(jìn)行合理定價,將該商品按事先擬定的價格進(jìn)行試銷,單價x/元8.28.48.68.8銷量y/件848278m若該商品的銷量y(單位:件)與單價x(單位:元)之間的經(jīng)驗(yàn)回歸方程為y=-26x+a,且樣本點(diǎn)(8.4,82)處的殘差為1.4,則實(shí)數(shù)m= ()A.66 B.68 C.70 D.72(2)在一元線性回歸模型中,能說明模型的擬合效果越好的是 ()A.殘差圖越寬B.殘差平方和越小C.決定系數(shù)R2越小D.樣本相關(guān)系數(shù)r越大(3)[2024·陜西西安模擬]某中醫(yī)藥企業(yè)根據(jù)市場調(diào)研與模擬,得到研發(fā)投入x(單位:億元)與產(chǎn)品收益y(單位:億元)的一組數(shù)據(jù)如下.研發(fā)投入x(單位:億元)12345產(chǎn)品收益y(單位:億元)3791011(i)計(jì)算x,y的樣本相關(guān)系數(shù)r,并判斷是否可以認(rèn)為研發(fā)投入與產(chǎn)品收益具有較強(qiáng)的線性相關(guān)程度?(若0.3<|r|<0.75,則線性相關(guān)程度一般;若|r|≥0.75,則線性相關(guān)程度較強(qiáng))(ii)求出y關(guān)于x的經(jīng)驗(yàn)回歸方程,并預(yù)測若想產(chǎn)品收益超過20億元,則研發(fā)投入至少約為多少億元?(結(jié)果保留兩位小數(shù))參考公式:經(jīng)驗(yàn)回歸直線y=bx+a的斜率和截距的最小二乘估計(jì)分別為b=∑i=1n(xi-x)(yi-y)題型2非線性回歸模型例3(1)某中學(xué)課外活動小組為了研究經(jīng)濟(jì)走勢,根據(jù)該市2002~2024年的貨物出口額數(shù)據(jù)繪制出如圖所示的散點(diǎn)圖,該小組選擇了如下2個模型來擬合貨物出口額y(單位:億元)隨年份代碼x的變化情況.模型一:y=kx+b(k>0,x>0);模型二:y=kex+b(k>0,x>0).則下列說法正確的是 ()A.變量y與x負(fù)相關(guān)B.模型一的擬合效果更好C.變量y與x有較強(qiáng)的線性相關(guān)程度D.模型二的擬合效果更好(2)[2024·山西長治期末]蝗蟲能對農(nóng)作物造成嚴(yán)重傷害,每只蝗蟲的平均產(chǎn)卵數(shù)y(單位:個)和平均溫度x(單位:℃)有關(guān),根據(jù)以往在某地收集到的7對數(shù)據(jù)作出散點(diǎn)圖,如圖所示,發(fā)現(xiàn)兩個變量并不呈現(xiàn)線性相關(guān)關(guān)系,現(xiàn)分別用模型①y=c1x2+c2與模型②y=ec3x+c4將得到的數(shù)據(jù)進(jìn)行初步處理,得到下表:平均溫度x21232527293235平均產(chǎn)卵數(shù)y59222565118324t=x244152962572984110241225z=lny1.612.203.093.224.174.775.78xtyz27.43773.4381.143.55∑∑∑∑20.030.370.290.0052其中ti=xi2,t=17∑i=17ti,zi=ln(i)根據(jù)表中數(shù)據(jù),經(jīng)計(jì)算得出模型①下的回歸方程為y=0.37x2-205.03,請建立模型②下y關(guān)于x的回歸方程,并在兩個模型下分別預(yù)測平均溫度為30℃時的平均產(chǎn)卵數(shù);(c3,c4與預(yù)測值均精確到小數(shù)點(diǎn)后兩位,參考數(shù)據(jù):e4.25≈70.11,e4.30≈73.70,e4.35≈77.48)(ii)已知模型①②的決定系數(shù)分別為R12≈0.812,R22≈0總結(jié)反思1.一元線性回歸分析問題的解題步驟:(1)求經(jīng)驗(yàn)回歸方程.①根據(jù)散點(diǎn)圖判斷兩變量是否線性相關(guān)(已知相關(guān)時不必再驗(yàn)證).②利用公式,求出參數(shù)b.③利用經(jīng)驗(yàn)回歸直線過點(diǎn)(x,y)求參數(shù)a.(2)利用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測,把經(jīng)驗(yàn)回歸方程看作一次函數(shù),求函數(shù)值作為預(yù)測值.2.非線性回歸分析問題的解題方法與常見變換:(1)解題方法:借助散點(diǎn)圖,確定合適的非線性回歸模型,再通過變換,轉(zhuǎn)化為求經(jīng)驗(yàn)回歸方程,最后還原.(2)常見非線性回歸方程的變換:y【對點(diǎn)演練2】(1)[2024·海南??谄谀以下關(guān)于一元線性回歸模型的說法中,錯誤的是 ()A.樣本相關(guān)系數(shù)r的絕對值越接近0,兩個變量的線性相關(guān)程度越弱B.在殘差圖中,殘差點(diǎn)分布的水平帶狀區(qū)域越窄,說明模型的擬合效果越好C.點(diǎn)(x,y)一定在經(jīng)驗(yàn)回歸直線y=bx+a上D.若經(jīng)驗(yàn)回歸方程為y=3x+10,則x每增加1個單位,y的值就平均增加10個單位(2)[2024·廣東廣州期末]某學(xué)校數(shù)學(xué)興趣小組在探究姜撞奶隨著時間變化的降溫及凝固情況的數(shù)學(xué)建?;顒又?將時間x(單位:分鐘)與溫度y(單位:攝氏度)的關(guān)系用模型y=c1ec2x(其中e為自然對數(shù)的底數(shù))擬合.設(shè)z=lnyx22.533.54z4.044.013.983.963.91由上表可得經(jīng)驗(yàn)回歸方程z=-0.062x+a,則c1等于 ()A.-4 B.e-4 C.4.166 D.e4.166獨(dú)立性檢驗(yàn)例4(1)[2024·天津?yàn)I海新區(qū)期末]為了調(diào)查是否騎共享單車與城市的擁堵情況是否有關(guān)聯(lián),某同學(xué)從交通擁堵嚴(yán)重的A城市和交通擁堵不嚴(yán)重的B城市各隨機(jī)調(diào)查了20名市民,得到的具體數(shù)據(jù)如下面的2×2列聯(lián)表:單位:人是否騎共享單車地點(diǎn)合計(jì)A城市B城市騎15823不騎51217合計(jì)202040則下列說法中正確的是 ()A.根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),認(rèn)為“是否騎共享單車與城市的擁堵情況沒有關(guān)聯(lián)”B.根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),認(rèn)為“是否騎共享單車與城市的擁堵情況有關(guān)聯(lián)”C.根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),認(rèn)為“是否騎共享單車與城市的擁堵情況有關(guān)聯(lián)”D.根據(jù)小概率值α=0.005的獨(dú)立性檢驗(yàn),認(rèn)為“是否騎共享單車與城市的擁堵情況有關(guān)聯(lián)”(2)[2024·黑龍江綏化期末]為探究藥物A對疾病B的治療效果,將40名患者均分為兩組,分別為對照組(未服藥)和實(shí)驗(yàn)組(服藥).測得40名患者血液中的某項(xiàng)指標(biāo)數(shù)據(jù)如下(單位:mg).(數(shù)據(jù)已按從小到大的順序排好)對照組:18.319.420.121.422.623.424.424.925.325.926.226.726.826.826.927.327.427.527.635.3實(shí)驗(yàn)組:4.45.35.86.97.38.1 8.4 9.0 10.4 13.213.4 16.3 18.2 19.3 23.624.1 24.5 24.7 25.2 25.3(i)求40名患者血液中的該項(xiàng)指標(biāo)數(shù)據(jù)的中位數(shù)m,并完成下面的2×2列聯(lián)表:單位:人藥物A疾病B的指標(biāo)數(shù)據(jù)合計(jì)<m≥m對照組實(shí)驗(yàn)組合計(jì)(ii)依據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),能否認(rèn)為藥物A對治療疾病B有效呢?(該項(xiàng)指標(biāo)數(shù)據(jù)小于m則有效)附:χ2=n(ad-bc)α0.100.0100.001xα2.7066.63510.828總結(jié)反思獨(dú)立性檢驗(yàn)的一般步驟:第一步,提出零假設(shè)H0:兩個分類變量A和B沒有關(guān)聯(lián);第二步,根據(jù)2×2列聯(lián)表和公式計(jì)算χ2的值;第三步,查對臨界值表,作出判斷.【對點(diǎn)演練3】(1)[2024·山東

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論