版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第9章相關分析與一元回歸分析9.1相關分析9.2回歸分析第9章相關分析與一元回歸分析變量之間的關系可以分為函數關系和相關關系兩類,函數關系表示變量間確定的對應關系,而相關關系則是變量間的某種非確定的依賴關系.相關分析主要是研究隨機變量間相關關系的形式和程度,在相關關系的討論中,兩個變量的地位是同等的,所使用的測度工具是相關系數;而回歸分析則側重考察變量之間的數量伴隨關系,并通過一定的數學表達式將這種數量關系描述出來,用于解決預測和控制等實際問題.本章主要學習相關分析和一元回歸分析的有關概念、理論和方法.第9章相關分析與一元回歸分析【回歸名稱的來歷】
“回歸”這一詞最早出現在1885年,英國生物學家兼統(tǒng)計學家—弗朗西斯
高爾頓(FrancisGalton)在研究遺傳現象時引進了這一名詞.他研究分析了孩子和父母身高關系后發(fā)現:雖然高個子的父母會有高個子的后代,但后代的增高并不與父母的增高等量.他稱這一現象為“向平常高度的回歸”.第9章相關分析與一元回歸分析【回歸名稱的來歷】
雖然高個子的父母會有高個子的后代,但后代的增高并不與父母的增高等量.他稱這一現象為“向平常高度的回歸”.爾后,他的朋友麥爾遜等人搜集了上千個家庭成員的身高數據,分析出兒子的平均身高和父親的身高x大致為如下關系:
(英寸)【回歸名稱的來歷】這表明:(1)父親身高增加1英寸,其兒子的身高平均增加0.516英寸.(2)高個子父輩有生高個子兒子的趨勢,但兒子的平均身高要比于父輩低一些.如x=80,那么低于父輩的平均身高.(3)低個子父輩的兒子們雖為低個子,但其平均身高要比于父輩高一些.如x=60,那么,高于父輩的平均身高.【回歸名稱的來歷】可見兒子的高度趨向于“回歸”到平均值而不是更極端,這就是“回歸”一詞的最初含義.誠然,如今對回歸這一概念的理解并不是高爾頓的原意,但這一名詞卻一直沿用下來,成為數理統(tǒng)計中最常用的概念之一.回歸分析的思想早已滲透到數理統(tǒng)計學科的其他分支,隨著計算機的發(fā)展和各種統(tǒng)計軟件的出現,回歸分析的應用越來越廣泛.第9章相關分析與一元回歸分析9.1相關分析在大量的實際問題中,隨機變量之間雖有某種關系,但這種關系很難找到一種精確的表示方法來描述.例如,人的身高與體重之間有一定的關系,知道一個人的身高可以大致估計出他的體重,但并不能算出體重的精確值.其原因在于人有較大的個體差異,因而身高和體重的關系,是既密切但又不能完全確定的關系.隨機變量間類似的這種關系在大自然和社會中屢見不鮮.第9章相關分析與一元回歸分析9.1相關分析例如,農作物產量與施肥量的關系商業(yè)活動中銷售量與廣告投入的關系人的年齡與血壓的關系每種股票的收益與整個市場收益的關系家庭收入與支出的關系等等.9.1相關分析這種大量存在于隨機變量間既互相聯系,但又不是完全確定的關系,稱為相關關系.
從數量的角度去研究這種關系,是數理統(tǒng)計的一個任務.這包括通過觀察試驗數據去判斷隨機變量之間有無關系,對其關系大小作出數量上的估計,我們把這種統(tǒng)計分析方法稱為相關分析.相關分析通常包括考察隨機變量觀測數據的散點圖、計算樣本相關系數以及對總體相關系數的顯著性檢驗等內容.9.1.1散點圖散點圖是描述變量之間關系的一種直觀方法.用坐標的橫軸代表自變量X,縱軸代表因變量Y,每組觀測數據(xi,yi)在坐標系中用一個點表示,由這些點形成的散點圖描述了兩個變量之間的大致關系,從中可以直觀地看出變量之間的關系形態(tài)及關系強度.圖9.1是不同形態(tài)的散點圖.
(a)(b)(c)(d)
(a)(b)(c)(d)從散點圖可以看出,變量間相關關系的表現形態(tài)大體上可分為線性相關、非線性相關、不相關等幾種.9.1.1散點圖
(a)(b)(c)(d)就兩個變量而言,如果變量之間的關系近似地表現為一條直線,則稱為線性相關,如圖9.1(a)和(b);如果變量之間的關系近似地表現為一條曲線,則稱為非線性相關或曲線相關,如圖9.1(c);如果兩個變量的觀測點很分散,無任何規(guī)律,則表示變量之間沒有相關關系,如圖9.1(d).9.1.1散點圖通過散點圖可以判斷兩個變量之間有無相關關系,并對變量間的關系形態(tài)做出大致的描述但散點圖不能準確反映變量之間的關系密切程度.因此,為準確度量兩個變量之間的關系密切程度,需要計算相關系數.9.1.1散點圖9.1相關分析9.1.2相關系數相關系數是對兩個隨機變量之間線性關系密切程度的度量.若相關系數是根據兩個變量全部數據計算的,稱為總體相關系數.設X,Y為兩個隨機變量,由定義4.5知,當D(X)D(Y)
0時,總體相關系數的計算公式為:其中Cov(X,Y)為變量X和Y的協方差,D(X)和D(Y)分別為X和Y的方差.9.1.2相關系數設(xi,yi),i=1,2,…,n,為(X,Y)的樣本,記定義9.1若sxsy
0,稱為{xi}和{yi}的相關系數(也可簡稱為樣本相關系數).rxy常簡記為r.9.1.2相關系數可以證明rxy具有下面兩條性質:(1)|rxy|
1(2)|rxy|=1時,(xi,yi),i=1,2,…,n在一條直線上.定義9.2當rxy>0時,稱{xi}和{yi}正相關當rxy<0時,稱{xi}和{yi}負相關當rxy=0時,稱{xi}和{yi}不相關.
9.1.2相關系數在實際應用中,為了說明{xi}和{yi}的相關程度,通常將相關程度分為以下幾種情況:當|rxy|≥0.8時,可視{xi}與{yi}為高度線性相關;0.5≤|rxy|<0.8時,可視{xi}與{yi}為中度線性相關;0.3≤|rxy|<0.5時,視{xi}與{yi}為低度線性相關;當|rxy|<0.3時,說明{xi}與{yi}的線性相關程度極弱.9.1.2相關系數說明:(1)有時個別極端數據可能影響樣本相關系數,應用中要多加注意.(2)rxy=0,只能說明{xi}與{yi}之間不存在線性關系,并不能說明{xi}與{yi}之間無其他關系.(3)一般情況下,總體相關系數ρXY是未知的,通常是將樣本相關系數rxy作為ρXY的估計值,于是常用樣本相關系數推斷兩變量間的相關關系.這一點要和相關系數的顯著性檢驗結合起來應用.【例9.1】用來評價商業(yè)中心經營好壞的一個綜合指標是單位面積的營業(yè)額,它是單位時間內(通常為一年)的營業(yè)額與經營面積的比值.對單位面積營業(yè)額的影響因素的指標有單位小時車流量、日人流量、居民年平均消費額、消費者對商場的環(huán)境、設施及商品的豐富程度的滿意度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 周口市醫(yī)院拔河培訓課件
- 2025-2026學年秋季學期XX市實驗學校班主任經驗交流會材料:班級文化建設與自主管理策略
- 墻壁上的圖案課件
- 員工自信心態(tài)培訓
- 倉庫危險化學品培訓
- 員工用電安全培訓
- 高考物理 探究平拋運動的特點知識和經典試題解析
- 員工消防培訓課件
- 員工普通話培訓
- 酒店客房預訂退訂合同協議
- 《微生物與殺菌原理》課件
- 醫(yī)療機構藥事管理規(guī)定版
- DB34T 1909-2013 安徽省鉛酸蓄電池企業(yè)職業(yè)病危害防治工作指南
- 北京市歷年中考語文現代文之議論文閱讀30篇(含答案)(2003-2023)
- 檔案學概論-馮惠玲-筆記
- 全國民用建筑工程設計技術措施-結構
- (正式版)YST 1693-2024 銅冶煉企業(yè)節(jié)能診斷技術規(guī)范
- 1999年勞動合同范本【不同附錄版】
- 全國優(yōu)質課一等獎職業(yè)學校教師信息化大賽《語文》(基礎模塊)《我愿意是急流》說課課件
- 初三寒假家長會ppt課件全面版
- 2023年中國造紙化學品發(fā)展現狀與趨勢
評論
0/150
提交評論