第6課時(shí)變量的相關(guān)關(guān)系與統(tǒng)計(jì)案例一輪復(fù)習(xí)講義_第1頁(yè)
第6課時(shí)變量的相關(guān)關(guān)系與統(tǒng)計(jì)案例一輪復(fù)習(xí)講義_第2頁(yè)
第6課時(shí)變量的相關(guān)關(guān)系與統(tǒng)計(jì)案例一輪復(fù)習(xí)講義_第3頁(yè)
第6課時(shí)變量的相關(guān)關(guān)系與統(tǒng)計(jì)案例一輪復(fù)習(xí)講義_第4頁(yè)
第6課時(shí)變量的相關(guān)關(guān)系與統(tǒng)計(jì)案例一輪復(fù)習(xí)講義_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6課時(shí)變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例考點(diǎn)點(diǎn)擊變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例考向定位1、重在考查散點(diǎn)圖,變量間的相關(guān)關(guān)系的判定以及求回歸直線方程,命題的形式是選擇或填空;2、統(tǒng)計(jì)案例的考查主要是通過案例體會(huì)統(tǒng)計(jì)方法解決實(shí)際問題的思想方法,因?yàn)檫\(yùn)算復(fù)雜,故出現(xiàn)選擇或填空題的可能性較大??季V解讀1、獨(dú)立性檢驗(yàn)①了解獨(dú)立性檢驗(yàn)(只要求列聯(lián)表)的基本思想、方法及其簡(jiǎn)單應(yīng)用.②了解假設(shè)檢驗(yàn)的基本思想、方法及其簡(jiǎn)單應(yīng)用.2、回歸分析①了解聚類分析的基本思想、方法及其簡(jiǎn)單應(yīng)用.②了解回歸的基本思想、方法及其簡(jiǎn)單應(yīng)用.重難點(diǎn)1、獨(dú)立性檢驗(yàn)(只要求列聯(lián)表)的基本思想、方法及其簡(jiǎn)單應(yīng)用2、回歸的基本思想、方法及其簡(jiǎn)單應(yīng)用考點(diǎn)精講1、利用回歸分析的方法對(duì)兩個(gè)具有線性相關(guān)關(guān)系的變量進(jìn)行研究的步驟為:①畫出兩個(gè)變量的散點(diǎn)圖;②求回歸直線方程;③用回歸直線方程進(jìn)行預(yù)報(bào).其中求回歸直線方程是關(guān)鍵.而對(duì)于線性回歸模型來說,估計(jì)模型中的未知參數(shù)a和b的最好方法就是用最小二乘估計(jì)和,其計(jì)算公式為,2、作相關(guān)性檢驗(yàn),通過作散點(diǎn)圖,并觀察所給的數(shù)據(jù)列成的點(diǎn)是否在一條直線的附近來判定,這樣做既直觀又方便,因而對(duì)解決相關(guān)性檢驗(yàn)問題比較常用,但在作圖中,由于存在誤差,有時(shí)很難說這些點(diǎn)是不是分布在一條直線的附近,這時(shí)就很難判斷兩個(gè)變量之間是否具有相關(guān)關(guān)系.因此,給定樣本數(shù)據(jù),單純由散點(diǎn)圖判定其是否大致在一條直線附近主觀性太強(qiáng),回歸分析時(shí)還通常用相關(guān)系數(shù)r來檢驗(yàn)兩個(gè)變量之間線性相關(guān)關(guān)系的強(qiáng)弱.樣本相關(guān)系數(shù)的具體計(jì)算公式為:的絕對(duì)值越接近1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng);r的絕對(duì)值接近于0時(shí),表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.通常當(dāng)r大于時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系3、比較兩個(gè)不同回歸模型的擬合效果:首先建立回歸模型,其基本步驟是:①確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量;②畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性相關(guān)關(guān)系等);③由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程);④按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法);⑤得出結(jié)果后分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等),若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.建立起回歸模型后,利用殘差分析的方法來比較兩個(gè)不同回歸模型的擬合效果.其方法是:對(duì)于由給定的樣本點(diǎn)而得到的兩個(gè)回歸方程和,分別計(jì)算兩個(gè)回歸方程的殘差平方和與;若,則的效果比的好;反之,的效果不如的好.3、對(duì)于非線性回歸問題進(jìn)行回歸分析的方法是:(1)若問題中已給出經(jīng)驗(yàn)公式,這時(shí)可以將解釋變量進(jìn)行交換(換元),將變量的非線性關(guān)系轉(zhuǎn)化為線性關(guān)系,將問題化為線性回歸分析問題來解決.(2)若問題中沒有給出經(jīng)驗(yàn)公式,需要我們畫出已知數(shù)據(jù)的散點(diǎn)圖,通過與各種函數(shù)(如指數(shù)函數(shù)、對(duì)數(shù)函數(shù)、冪函數(shù)等)的圖象作比較,選擇一種與這些散點(diǎn)擬合得最好的函數(shù),然后采用適當(dāng)?shù)淖兞孔儞Q,將問題化為線性回歸分析問題來解決4、若要推斷的論述為:“X與Y有關(guān)系”,判斷結(jié)論成立的可能性的方法是:(1)三維柱形圖與二維條形圖可用于粗略地判斷兩個(gè)分類變量是否有關(guān)系.①在三維柱形圖中,主對(duì)角線上兩個(gè)柱形高的乘積ad與副對(duì)角線上兩個(gè)柱形高的乘積bc相差越大,兩個(gè)分類變量X與Y有關(guān)系的可能性就越大.②在二維條形圖中,可以估計(jì)圖形滿足的個(gè)體中具有的個(gè)體所占的比例,也可以估計(jì)滿足條件的個(gè)體中具有的個(gè)體所占的比例,兩個(gè)比例相差越大,X與Y有關(guān)系的可能性就越大.但是三維柱形圖和二維條形圖無法精確地給出所得結(jié)論的可靠程度,因而只做粗略估計(jì),而不做具體運(yùn)算.(2)可以利用獨(dú)立性檢驗(yàn)來考察兩個(gè)分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度.具體做法是:根據(jù)觀測(cè)數(shù)據(jù)計(jì)算檢驗(yàn)隨機(jī)變量的值,其值越大,說明“與有關(guān)系”成立的可能性越大.獨(dú)立性檢驗(yàn)的一般步驟是:①假設(shè)兩個(gè)分類變量X與Y無關(guān)系;②計(jì)算出的觀測(cè)值;③把k的值與臨界值比較確定X與Y有關(guān)系的程度或無關(guān)系.熱點(diǎn)題例例1、某地10戶家庭的年收入和年飲食支出的統(tǒng)計(jì)資料如下表:年收入(萬(wàn)元)24466677810年飲食支出(萬(wàn)元)(1)根據(jù)表中數(shù)據(jù),確定家庭的年收入和年飲食支出的相關(guān)關(guān)系;(2)如果某家庭年收入為9萬(wàn)元,預(yù)測(cè)其年飲食支出.解析:(1)由題意知,年收入x為解釋變量,年飲食支出y為預(yù)報(bào)變量,作散點(diǎn)圖(如圖所示).從圖中可以看出,樣本點(diǎn)呈條狀分布,年收入和年飲食支出有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程刻畫它們之間的關(guān)系.,,,,..從而得到回歸直線方程為.(2)萬(wàn)元.點(diǎn)評(píng):①是斜率的估計(jì)值,說明年收入x每增加一萬(wàn)元,年飲食支出y就增加萬(wàn)元,這表明了年飲食支出與年收入具有正的線性相關(guān)關(guān)系.②對(duì)于該家庭年收入為9萬(wàn)元,由回歸方程得到的年飲食支出的預(yù)報(bào)值萬(wàn)元,并不能說該家庭的年飲食支出一定是萬(wàn)元.一般說來,不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值.事實(shí)上,它是預(yù)報(bào)變量的可能取值的平均值.例2、為了了解某地母親身高x與女兒身高y的相關(guān)關(guān)系,現(xiàn)隨機(jī)測(cè)得10對(duì)母女的身高,所得數(shù)據(jù)如下表所示:母親身高(cm)159160160163159154159158159157女兒身高(cm)158159160161161155162157162156試對(duì)x與y進(jìn)行回歸分析,并預(yù)報(bào)當(dāng)母親身高為161cm時(shí),女兒的身高為多少?解析:作線性相關(guān)性檢驗(yàn),,,,.因此.表明x與y有線性相關(guān)關(guān)系,因而求回歸直線方程有必要.又,.由此可得回歸直線方程為.斜率的估計(jì)值反映出當(dāng)母親身高每增加1cm時(shí),女兒身高平均增加0.78cm,可以理解為女兒身高中不受母親身高影響的部分.當(dāng)母親身高為cm時(shí),預(yù)報(bào)女兒身高為cm,這就是說當(dāng)母親身高為161cm時(shí),女兒身高大致也為161cm.點(diǎn)評(píng):本題是一個(gè)回歸分析類問題.解決這一問題,首先應(yīng)對(duì)問題進(jìn)行必要的相關(guān)性檢驗(yàn),如果x與y之間具有線性相關(guān)關(guān)系,再求出對(duì)應(yīng)的回歸直線的方程,最后利用回歸直線方程由解釋變量x的值得到預(yù)報(bào)變量y的值.例3、某種圖書每?jī)?cè)的成本費(fèi)y(元)與印刷冊(cè)數(shù)x(千冊(cè))有關(guān),經(jīng)統(tǒng)計(jì)得到數(shù)據(jù)如下:123510203050100200檢驗(yàn)每?jī)?cè)書的成本費(fèi)y與印刷冊(cè)數(shù)的倒數(shù)之間是否有線性相關(guān)關(guān)系,如果有,求出y對(duì)x的回歸方程.解析:首先作變量變換,令,則題目所給數(shù)據(jù)變成如下表所示的數(shù)據(jù):1可以求得,由,因此變量與之間具有較強(qiáng)的線性相關(guān)關(guān)系,并且,,最后回代可得.因此與的回歸方程為.點(diǎn)評(píng):本題中y與x之間不具有線性回歸關(guān)系,因而是非線性回歸分析問題,通過變量變換,即令,并通過對(duì)u與y作相關(guān)性檢驗(yàn),判定出y與u之間具有較強(qiáng)的線性相關(guān)關(guān)系后,求出y對(duì)u的回歸直線方程,最后再回代,得到y(tǒng)對(duì)x的回歸方程.達(dá)標(biāo)測(cè)試選擇題:在畫兩個(gè)變量的散點(diǎn)圖時(shí),下面哪個(gè)敘述是正確的()(A)預(yù)報(bào)變量在軸上,解釋變量在軸上(B)解釋變量在軸上,預(yù)報(bào)變量在軸上(C)可以選擇兩個(gè)變量中任意一個(gè)變量在軸上(D)可以選擇兩個(gè)變量中任意一個(gè)變量在軸上2、設(shè)兩個(gè)變量x和y之間具有線性相關(guān)關(guān)系,它們的相關(guān)系數(shù)是r,y關(guān)于x的回歸直線的斜率是b,縱截距是a,那么必有()(A)b與r的符號(hào)相同(B)a與r的符號(hào)相同(C)b與r的相反(D)a與r的符號(hào)相反3、一位母親記錄了兒子3~9歲的身高,由此建立的身高與年齡的回歸模型為y=+用這個(gè)模型預(yù)測(cè)這個(gè)孩子10歲時(shí)的身高,則正確的敘述是()(A)身高一定是(B)身高在以上(C)身高在以下(D)身高在左右4、兩個(gè)變量與的回歸模型中,分別選擇了4個(gè)不同模型,它們的相關(guān)指數(shù)如下,其中擬合效果最好的模型是()(A)模型1的相關(guān)指數(shù)為(B)模型2的相關(guān)指數(shù)為(C)模型3的相關(guān)指數(shù)為(D)模型4的相關(guān)指數(shù)為5、工人月工資(元)依勞動(dòng)生產(chǎn)率(千元)變化的回歸直線方程為,下列判斷正確的是()(A)勞動(dòng)生產(chǎn)率為1000元時(shí),工資為50元(B)勞動(dòng)生產(chǎn)率提高1000元時(shí),工資提高150元(C)勞動(dòng)生產(chǎn)率提高1000元時(shí),工資提高90元(D)勞動(dòng)生產(chǎn)率為1000元時(shí),工資為90元6、為研究變量和的線性相關(guān)性,甲、乙二人分別作了研究,利用線性回歸方法得到回歸直線方程和,兩人計(jì)算知相同,也相同,下列正確的是()(A)與重合(B)與一定平行(C)與相交于點(diǎn)(D)無法判斷和是否相交7、考察棉花種子經(jīng)過處理跟生病之間的關(guān)系得到如下表數(shù)據(jù):種子處理種子未處理合計(jì)得病32101133不得病61213274合計(jì)93314407根據(jù)以上數(shù)據(jù),則()(A)種子經(jīng)過處理跟是否生病有關(guān)(B)種子經(jīng)過處理跟是否生病無關(guān)(C)種子是否經(jīng)過處理決定是否生病(D)以上都是錯(cuò)誤的8、變量與具有線性相關(guān)關(guān)系,當(dāng)取值16,14,12,8時(shí),通過觀測(cè)得到的值分別為11,9,8,5,若在實(shí)際問題中,的預(yù)報(bào)最大取值是10,則的最大取值不能超過()(A)16(B)17(C)15(D)12填空題:9、在研究身高和體重的關(guān)系時(shí),求得相關(guān)指數(shù)______________,可以敘述為“身高解釋了64%的體重變化,而隨機(jī)誤差貢獻(xiàn)了剩余的36%”所以身高對(duì)體重的效應(yīng)比隨機(jī)誤差的效應(yīng)大得多。10、某大學(xué)在研究性別與職稱(分正教授、副教授)之間是否有關(guān)系,你認(rèn)為應(yīng)該收集哪些數(shù)據(jù)?11、某高校“統(tǒng)計(jì)初步”課程的教師隨機(jī)調(diào)查了選該課的一些學(xué)生情況,具體數(shù)據(jù)如下表:性別專業(yè)非統(tǒng)計(jì)專業(yè)統(tǒng)計(jì)專業(yè)男1310女720為了判斷主修統(tǒng)計(jì)專業(yè)是否與性別有關(guān)系,根據(jù)表中的數(shù)據(jù),得到因?yàn)椋耘卸ㄖ餍藿y(tǒng)計(jì)專業(yè)與性別有關(guān)系,那么這種判斷出錯(cuò)的可能性為_____________12、許多因素都會(huì)影響貧窮,教育也許是其中之一,在研究這兩個(gè)因素的關(guān)系時(shí)收集了美國(guó)50個(gè)州的成年人受過9年或更少教育的百分比()和收入低于官方規(guī)定的貧困線的人數(shù)占本州人數(shù)的百分比()的數(shù)據(jù),建立的回歸直線方程如下,斜率的估計(jì)等于說明,成年人受過9年或更少教育的百分比()和收入低于官方的貧困線的人數(shù)占本州人數(shù)的百分比()之間的相關(guān)系數(shù)(填充“大于0”或“小于0”)三、解答題13、在對(duì)人們的休閑方式的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人。女性中有43人主要的休閑方式是看電視,另外27人主要的休閑方式是運(yùn)動(dòng);男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運(yùn)動(dòng)。(1)根據(jù)以上數(shù)據(jù)建立一個(gè)2×2的列聯(lián)表;(2)判斷性別與休閑方式是否有關(guān)系。14、某種書每?jī)?cè)的成本費(fèi)y(元)與印刷冊(cè)數(shù)x(千冊(cè))有關(guān),經(jīng)統(tǒng)計(jì)得到數(shù)據(jù)如下:x123510203050100200y檢驗(yàn)每?jī)?cè)書的成本費(fèi)y與印刷冊(cè)數(shù)的倒數(shù)之間是否具有線性相關(guān)關(guān)系,如有,求出y對(duì)x的回歸方程。參考答案選擇題1、B2、A3、D4、A5、C6、C7、B8、C二、填空題:964%10女教授人數(shù),男教授人數(shù),女副教授人數(shù),男副教授人數(shù)5%12一個(gè)地區(qū)受過9年或更少教育的百分比每增加1%,收入低于官方規(guī)定的貧困線的人數(shù)占本州人數(shù)的百分比將增加%左右;大于0三、解答題:13解:(1)2×2的列聯(lián)表性別休閑方式看電視運(yùn)動(dòng)總計(jì)女432770男213354總計(jì)6460124(2)假設(shè)“休閑方式與性別無關(guān)”計(jì)算因?yàn)椋杂欣碛烧J(rèn)為假設(shè)“休閑方式與性別無關(guān)”是不合理的,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論