版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
11.2成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析考點(diǎn)清單題型清單目錄考點(diǎn)1變量間的相關(guān)關(guān)系考點(diǎn)2獨(dú)立性檢驗(yàn)題型一變量間的相關(guān)關(guān)系及回歸方程題型二獨(dú)立性檢驗(yàn)考點(diǎn)1變量間的相關(guān)關(guān)系1.相關(guān)關(guān)系兩個(gè)變量有關(guān)系,但又沒有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這種關(guān)
系稱為相關(guān)關(guān)系.溫馨提示
相關(guān)關(guān)系與函數(shù)關(guān)系均是指兩個(gè)變量的關(guān)系,但函數(shù)關(guān)系是一種確定的關(guān)
系,相關(guān)關(guān)系是一種非確定的關(guān)系.2.散點(diǎn)圖將各數(shù)據(jù)在平面直角坐標(biāo)系中的對(duì)應(yīng)點(diǎn)畫出來,得到表示兩個(gè)變量的一組數(shù)據(jù)的圖形,
這樣的圖形叫做散點(diǎn)圖.利用散點(diǎn)圖,可以判斷兩個(gè)變量是否相關(guān),相關(guān)時(shí)是正相關(guān)還是
負(fù)相關(guān).3.正相關(guān)和負(fù)相關(guān)(1)正相關(guān):從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)增加的趨
勢,我們就稱這兩個(gè)變量正相關(guān).(2)負(fù)相關(guān):從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)減少的趨勢,
則稱這兩個(gè)變量負(fù)相關(guān).4.線性相關(guān)和非線性相關(guān)(1)一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線附近,我
們就稱這兩個(gè)變量線性相關(guān).(2)一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量非線
性相關(guān)或曲線相關(guān).5.樣本相關(guān)系數(shù)(1)r=
=
,稱r為變量x和變量y的樣本相關(guān)系數(shù).(2)樣本相關(guān)系數(shù)r是一個(gè)描述成對(duì)樣本數(shù)據(jù)的數(shù)字特征,它的正負(fù)性和絕對(duì)值的大小可
以反映成對(duì)樣本數(shù)據(jù)的變化特征:①當(dāng)r>0時(shí),稱成對(duì)樣本數(shù)據(jù)正相關(guān);②當(dāng)r<0時(shí),稱成對(duì)樣本數(shù)據(jù)負(fù)相關(guān).(3)樣本相關(guān)系數(shù)r的取值范圍為[-1,1],樣本相關(guān)系數(shù)r的絕對(duì)值大小可以反映成對(duì)數(shù)據(jù)
之間線性相關(guān)的程度:①當(dāng)|r|越接近1時(shí),成對(duì)數(shù)據(jù)的線性相關(guān)程度越強(qiáng);②當(dāng)|r|越接近0時(shí),成對(duì)數(shù)據(jù)的線性相關(guān)程度越弱.6.一元線性回歸模型(1)經(jīng)驗(yàn)回歸方程我們將
=
x+
稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,其中
提醒
1.根據(jù)經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測,得到的僅是一個(gè)估計(jì)值,而不一定是真實(shí)發(fā)生的
值.2.經(jīng)驗(yàn)回歸直線一定過樣本點(diǎn)的中心,即必過點(diǎn)(
,
).(2)判斷模型擬合效果的方式①利用殘差平方和:
(yi-
)2,殘差平方和越小,擬合效果越好.②利用殘差圖:若殘差比較均勻地分布在以取值為0的橫軸為對(duì)稱軸的水平帶狀區(qū)域
內(nèi),該區(qū)域越窄,說明擬合效果越好.(殘差:觀測值減去預(yù)測值)③利用決定系數(shù)R2:R2=1-
,R2越大,擬合效果越好.考點(diǎn)2獨(dú)立性檢驗(yàn)1.2×2列聯(lián)表假設(shè)兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為XY合計(jì)y1y2x1aba+bx2cdc+d合計(jì)a+cb+da+b+c+d2×2列聯(lián)表給出了成對(duì)分類變量數(shù)據(jù)的交叉分類頻數(shù).可構(gòu)造一個(gè)隨機(jī)變量χ2=
,其中n=a+b+c+d為樣本容量.2.獨(dú)立性檢驗(yàn)利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立
性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn).即練即清1.判斷正誤.(對(duì)的打“√”,錯(cuò)的打“?”)(1)散點(diǎn)圖是判斷兩個(gè)變量相關(guān)關(guān)系的一種重要方法和手段.
(
)(2)殘差平方和越大,模型的擬合效果越好.
(
)(3)經(jīng)驗(yàn)回歸直線
=
x+
至少經(jīng)過點(diǎn)(x1,y1),(x2,y2),…,(xn,yn)中的一個(gè)點(diǎn).
(
)(4)若分類變量X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計(jì)算得到的χ2的觀測值越小.
(
)√×××2.某食品研究部門為了解一種酒品的儲(chǔ)藏年份與芳香度之間的相關(guān)關(guān)系,在市場上收
集到了一部分不同儲(chǔ)藏年份的該酒品,并測定了其芳香度(如表).儲(chǔ)藏年份x014568芳香度y1.31.85.6
7.49.3由最小二乘法得到經(jīng)驗(yàn)回歸方程
=1.03x+1.13,但不小心在檢測后滴到表格上一滴檢測液,污損了一個(gè)數(shù)據(jù),則推斷該數(shù)據(jù)為
.6.1題型一變量間的相關(guān)關(guān)系及回歸方程典例1
(2025屆河南省實(shí)驗(yàn)中學(xué)開學(xué)考,17)為實(shí)施鄉(xiāng)村振興,科技興農(nóng),某村建起了田
園綜合體,并從省城請(qǐng)來專家進(jìn)行技術(shù)指導(dǎo).根據(jù)統(tǒng)計(jì),該田園綜合體西紅柿畝產(chǎn)量的增
加量y(千克)與某種液體肥料每畝使用量x(千克)之間的對(duì)應(yīng)數(shù)據(jù)如下.x/千克24568y/千克300400400400500(1)由上表數(shù)據(jù)可知,可用線性回歸模型擬合y與x的關(guān)系,請(qǐng)計(jì)算相關(guān)系數(shù)r并加以說明
(若|r|>0.75,則線性相關(guān)程度很高,可用線性回歸模型擬合);(2)求y關(guān)于x的經(jīng)驗(yàn)回歸方程,并預(yù)測當(dāng)液體肥料每畝使用量為20千克時(shí),西紅柿畝產(chǎn)量
的增加量約為多少千克.附:對(duì)于一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸直線的斜率和截距的最小二乘估計(jì)公式,
相關(guān)系數(shù)r的公式分別為
=
,
=
-
,r=
.參考數(shù)據(jù):
≈3.16.解析
(1)由已知數(shù)據(jù)可得
=
=5,
=
=400,
(xi-
)(yi-
)=600,
(xi-
)2=20,
(yi-
)2=20000,∴相關(guān)系數(shù)r=
=
≈0.95.∵|r|>0.75,∴可用線性回歸模型擬合y與x的關(guān)系.(2)由(1)知
=
=
=30,∴
=400-30×5=250,∴經(jīng)驗(yàn)回歸方程為
=30x+250,當(dāng)x=20時(shí),
=30×20+250=850,即當(dāng)液體肥料每畝使用量為20千克時(shí),西紅柿畝產(chǎn)量的增加量約為850千克.方法總結(jié)
求經(jīng)驗(yàn)回歸方程的步驟1.計(jì)算出
、
、
+
+…+
、x1y1+x2y2+…+xnyn;2.計(jì)算
、
;3.寫出經(jīng)驗(yàn)回歸方程
=
x+
.變式訓(xùn)練1-1
(關(guān)鍵元素變式)某工廠生產(chǎn)一種產(chǎn)品測得數(shù)據(jù)如下:尺寸x/mm384858687888質(zhì)量y/g16.818.820.722.42425.5(1)若按照檢測標(biāo)準(zhǔn),合格產(chǎn)品的質(zhì)量y(g)與尺寸x(mm)之間近似滿足關(guān)系式y(tǒng)=c·xd(c,d為
大于0的常數(shù)),求y關(guān)于x的經(jīng)驗(yàn)回歸方程;(2)已知產(chǎn)品的收益z(單位:千元)與產(chǎn)品尺寸和質(zhì)量的關(guān)系為z=2y-0.32x,根據(jù)(1)中經(jīng)驗(yàn)
回歸方程分析,當(dāng)產(chǎn)品的尺寸x約為何值時(shí)(結(jié)果用整數(shù)表示),收益z的預(yù)報(bào)值最大?附:①參考數(shù)據(jù):
(lnxi·lnyi)≈75.3,
lnxi≈24.6,
lnyi≈18.3,
(lnxi)2≈101.4.②參考公式:對(duì)于樣本數(shù)據(jù)(vi,ui)(i=1,2,…,n),其經(jīng)驗(yàn)回歸直線
=
v+
的斜率和截距的最小二乘估計(jì)公式分別為
=
=
,
=
-
,e≈2.7182.解析
(1)第一步:兩邊取自然對(duì)數(shù),將非線性關(guān)系轉(zhuǎn)化為線性關(guān)系.對(duì)y=c·xd(c,d>0)兩邊取自然對(duì)數(shù)得lny=lnc+dlnx.令vi=lnxi,ui=lnyi,則
=
v+
,其中
=lnc.第二步:利用公式求出經(jīng)驗(yàn)回歸方程.根據(jù)所給統(tǒng)計(jì)量及最小二乘估計(jì)公式得
=
=
≈
=
=
,
=
-
=
-
·
≈
-
×
=1,又
=lnc=1,所以c=e,所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為
=e·
.(2)由(1)得y=e·
,(2)由(1)得y=e·
,所以z=2e
-0.32x=-0.32(
)2+2e
.令t=
,則當(dāng)t=
時(shí),z取得最大值,此時(shí)x=t2≈72,所以當(dāng)產(chǎn)品的尺寸x約為72mm時(shí),收益z的預(yù)報(bào)值最大.歸納總結(jié)
求非線性回歸模型的步驟
題型二獨(dú)立性檢驗(yàn)典例2
(2025屆海南??诿?17)制訂適合自己的學(xué)習(xí)計(jì)劃并在學(xué)習(xí)過程中根據(jù)自己
的實(shí)際情況有效地安排和調(diào)整學(xué)習(xí)方法是一種有效的學(xué)習(xí)策略.某教師為研究學(xué)生制
訂學(xué)習(xí)計(jì)劃并堅(jiān)持實(shí)施和數(shù)學(xué)成績之間的關(guān)系,得到如下數(shù)據(jù):
成績>120分成績≤120合計(jì)制訂學(xué)習(xí)計(jì)劃并堅(jiān)持實(shí)施14620沒有制訂學(xué)習(xí)計(jì)劃22830合計(jì)163450(1)依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),能否認(rèn)為制訂學(xué)習(xí)計(jì)劃并堅(jiān)持實(shí)施和數(shù)學(xué)成績
高于120分有關(guān)聯(lián)?(2)若該校高三年級(jí)每月進(jìn)行一次月考,該校學(xué)生小明在高三開學(xué)初認(rèn)真制訂了學(xué)習(xí)計(jì)
劃,其中一項(xiàng)要求自己每天要把錯(cuò)題至少重做一遍,做對(duì)為止,以下為小明堅(jiān)持實(shí)施計(jì)劃
的月份和他在學(xué)校數(shù)學(xué)月考成績的校內(nèi)名次數(shù)據(jù):月考時(shí)間11月初12月初次年1月初次年2月初次年3月初時(shí)間代碼x12345月考校內(nèi)名次y881857729569475參考數(shù)據(jù):
xiyi=9433,
=702.2.(i)求月考校內(nèi)名次y與時(shí)間代碼x的經(jīng)驗(yàn)回歸方程
=
x+
;(ii)該校教師給出了上一年該校學(xué)生高考(6月初考試)數(shù)學(xué)成績在校內(nèi)的名次和在全省
名次的部分?jǐn)?shù)據(jù):校內(nèi)名次w5100200300全省名次u202576662780利用數(shù)據(jù)分析軟件,根據(jù)以上數(shù)據(jù)得出了兩個(gè)回歸模型和決定系數(shù)R2:模型①模型②
=9.5
-449
=28
R2=0.7927R2≈0.9973在以上兩個(gè)模型中選擇“較好”模型(說明理由),并結(jié)合問題(i)的回歸方程,依據(jù)“較
好”模型預(yù)測小明如果能堅(jiān)持實(shí)施學(xué)習(xí)計(jì)劃,他在次年高考中數(shù)學(xué)成績的全省名次(名
次均保留整數(shù)).(參考數(shù)據(jù):e2.272≈9.7,e2.432≈11.4,e0.672≈2.0)附:(1)χ2=
,其中n=a+b+c+d.α0.050.010.0050.001xα3.8416.6357.87910.828(2)對(duì)于一組數(shù)據(jù)(xi,yi)(i=1,2,3,…,n),其經(jīng)驗(yàn)回歸直線
=
x+
的斜率和截距的最小二乘估計(jì)公式分別為
=
=
,
=
-
.解析
(1)零假設(shè)為H0:制訂學(xué)習(xí)計(jì)劃并堅(jiān)持實(shí)施和數(shù)學(xué)成績高于120分沒有關(guān)聯(lián).由題中數(shù)據(jù)得χ2=
=
≈22.120>10.828=x0.001,依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即制訂學(xué)習(xí)計(jì)劃并堅(jiān)持實(shí)施和
數(shù)學(xué)成績高于120分有關(guān)聯(lián).(2)(i)由題知:
=
×(1+2+3+4+5)=3,
=12+22+32+42+52=55,所以
=
=
=-110,
=
-
=702.2-(-110)×3=1032.2,所以月考校內(nèi)名次y與時(shí)間代碼x的經(jīng)驗(yàn)回歸方程為
=-110x+1032.2.(ii)模型②為“較好”模型,因?yàn)槟P廷诘臎Q定系數(shù)大于模型①的決定系數(shù).高考對(duì)應(yīng)的時(shí)間代碼為8,預(yù)測小明高考數(shù)學(xué)成績的校內(nèi)名次為
=-110×8+1032.2=152.2≈152,全省名次為
=28e0.016×152=28e2.432=28×11.4=319.2≈319.所以預(yù)測小明高考數(shù)學(xué)成績的全省名次為319名.歸納總結(jié)
應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題的基本步驟1.提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問題中的解釋;2.根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值;3.查表確定臨界值xα;α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.8284.得出推斷結(jié)論.當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過α;當(dāng)χ2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.變式訓(xùn)練2-1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 油畫教資面試題目及答案
- 養(yǎng)殖公司數(shù)據(jù)管理制度
- 打工測試題目及答案
- 名校名企面試題目及答案
- 3.2代數(shù)式的值 課后培優(yōu)檢測(含答案) 人教版(2024)數(shù)學(xué)七年級(jí)上冊
- 養(yǎng)老院老人生活照顧人員培訓(xùn)制度
- 護(hù)理學(xué)專插本題目及答案
- 養(yǎng)老院老人健康管理制度
- 養(yǎng)老院工作人員著裝規(guī)范制度
- 續(xù)航測試面試題目及答案
- 安全附件管理制度規(guī)范
- 工程轉(zhuǎn)接合同協(xié)議
- 人教版(2024)七年級(jí)上冊數(shù)學(xué)期末綜合檢測試卷 3套(含答案)
- 涉密人員社交媒體使用保密指南
- 項(xiàng)目紙打印合同范本
- 研發(fā)資料規(guī)范管理制度(3篇)
- GB/T 16770.1-2025整體硬質(zhì)合金直柄立銑刀第1部分:型式與尺寸
- 工業(yè)產(chǎn)品銷售單位質(zhì)量安全日管控周排查月調(diào)度檢查記錄表
- 2025年風(fēng)險(xiǎn)管理自查報(bào)告
- DL∕T 5210.6-2019 電力建設(shè)施工質(zhì)量驗(yàn)收規(guī)程 第6部分:調(diào)整試驗(yàn)
- 江西省九江市九江一中2023學(xué)年化學(xué)高一第一學(xué)期期中復(fù)習(xí)檢測試題含解析
評(píng)論
0/150
提交評(píng)論